开云体育- 开云体育官方网站- APP下载 KAIYUN SPORTS文本聚类及其在电子病历分析中的应用研究pdf
2025-09-26开云体育官方,开云体育app,开云app下载,开云棋牌,开云官网,开云体育,开云电竞,开云,开云体育官网, 开云体育平台, 世界杯开云, 开云体育app下载, 开云体育网址, 开云体育2025
感谢您对本站的支持,您的赏金将帮助我们更好的发展。本次下载而产生的赏金将由本站以一定方式转交版权人和上传用户。
您支付成功后,系统会自动为您创建此邮箱/手机号的账号,密码跟您输入的邮箱/手机号一致,以方便您下次登录下载和查看订单。注:支付完成后需要自己下载文件,并不会自动发送文件哦!
3、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰
在文本聚类算法研究领域中,面对大规模、高维的文本集合,如何建立精度高、可扩展的聚类算法一直是研究者们努力的方向。传统文本聚类算法仍然存在着如下问题一是数据的高维问题,传统基于向量空间模型VSMVECTORSPACEMODEL的文本表示方法造成文本表示的维度过高,影响聚类的效率和精度二是聚类算法在大规模文本集上聚类效果的问题,即聚类算法需要良好的精度和可扩展性三是聚类结果簇的描述问题,一个好的类簇描述能够让人们直观的了解到每个类簇所代表的主题。解决以上三个问题一直是文本聚类领域的研究重点。同时随着医学信息化的发展,电子病历EMRELECTRONICMEDICALRECORD已经成为帮助患者诊疗的宝贵资源。相对于传统纸质病历的组织形式,电子病历提供了全新的病历管理模式,使查询、分析功能成为可能。但随着数字化医院的发展,电子病历的数量成指数级增长,如何组织海量的电子病历并对病历数据根据病种进行归类以及如何从中发掘有价值的信息或知识成为目前电子病历分析研究的一个热点问题。文本聚类作为一种无监督算法,它的应用之一就是在无标签信息的情况下将无组织的文本自动归类。针对以上文本聚类算法中的问题以及对文本聚类在电子病历中的组织化应用的研究调研,本文的贡献如下1提出一种基于频繁词集表示的文本聚类算法FICFREQUENTITEMSETSBASEDDOCUMENTCLUSTERINGMETHOD。该方法从文档集中挖掘出频繁词集,运用频繁词集来表示每个文本从而大大降低了文本维度。根据文本间相似度来建立文本网络,运用社区划分的算法对网络进行划分,从而达到聚类的目的。FIC算法不仅能降低文本表示的维度,还可以构建文本集中文本间的关联关系,使文本与文本间不再是独立的两两关系。2根据电子病历本身的数据特征提出一种基于频繁词集与词嵌入模型的电子病历混合聚类算法FICHYBRIDAHYBRIDEMRCLUSTERINGMETHODBASEDONFREQUENTITEMSETSANDWORDEMBEDDING,并将该方法用于电子病历的组织管理中通过在收集的真实电子病历中病历的聚类分析来验证本文算法在电子病历组织化应用中的有效性。
本文(文本聚类及其在电子病历分析中的应用研究.pdf)为本站会员(用此生追杀我)主动上传,众赏文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知众赏文库(发送邮件至或直接QQ联系客服),我们立即给予删除!