基于数据挖掘的问诊平台文本研究
【摘要】:近两年,医患问诊平台的发展使得患者得以在互联网上能够直接对话医生,进而解决一些并不需要到医院就能决绝的小问题。同时问诊平台上积累的医患问答文本数据也为洞察研究患者的需求和医生的行为提供了数据基础。本文基于互联网的医疗问诊平台《120快速问医生》上脂肪肝相关的医患问答文本,运用统计分析以及数据挖掘的方法来研究不同患者群关注脂肪肝的热点及其导因、不同医生群对患者提出治疗建议的思路以及具体的药品使用情况。本文首先介绍了数据来源及如何运用爬虫技术对平台相关的数据进行抓取(包括患者提问数据、医生回复数据);在数据预处理阶段,本文运用基于患者buying process编码的方法对患者的关注热点,医生的治疗建议进行编码分类;接着建立各分类维度属性的词库,并对基于词库对所有文本进行打标签;最后在模型建立部分利用K-means聚类分析、决策树模型、关联分析,对患者进行聚类并描绘不同群体的画像、对医生治疗建议思路进行模拟、对其用药规律进行分析。同时本文也站在药企的角度分析了护肝类药物易善复的市场情况。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|