期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

孟秋晴熊回香《情报科学》2021,39(6):152-160

【目的/意义】为了向在线医疗社区中的用户自动推荐符合其自身实际需求的医生,本文基于在线问诊文本信息,提出了基于相似用户与相似医生的混合医生推荐算法。【方法/过程】首先从用户咨询问题出发,找到具有相似咨询问题的用户,将其所选择的医生作为基于相似用户的推荐集合;然后从医生回答从发,通过LDA主题模型训练,从医生回答文本集中挖掘出隐含的疾病主题,按主题查找具有相似疾病诊治经验的医生作为推荐集合;最后通过混合相似度计算融合基于相似用户和相似医生的推荐结果,得到最终推荐列表。【结果/结论】通过对在线医疗社区“39健康网”进行实证研究,结果表明,利用本文提出的方法进行推荐,能够有效降低数据维度,挖掘文本间的潜在语义关联,有效缩小语义鸿沟,提升推荐质量,具有较好的推荐效果。【创新/局限】本文仅选取了针对科室的小样本数据进行实验,且部分参数使用经验值,未来可深入探讨该方法在大规模医疗数据集上的应用。相似文献

2.

一种融合标签和患者咨询文本的医生推荐算法

周鑫熊回香肖兵《情报科学》2023,(3):145-154

【目的/意义】针对在线医疗信息结构松散，医疗平台医生推荐精度不足的现状，设计了一种基于标签和患者咨询文本的医生推荐算法，提升医生推荐效果。【方法/过程】利用Word2vec模型训练患者咨询文本得到特征向量，改进余弦相似度算法计算医生推荐集A；利用LDA模型训练医生标签得到医生在主题上投影的概率分布，改进KL距离算法计算医生推荐集B；基于社会网络分析理论设计相关算法重构医生网络链接，选择中心性指标得到最终医生推荐集C。【结果/结论】以“丁香医生”数据进行实证，面向UGC数据丰富了算法的可用程度，弥补了单一推荐方法的不足，提高了推荐的精度。本文所提方法有效提升了医生推荐精度。【创新/局限】通过融合标签和患者咨询文本，采用社会网络分析实现了医生混合推荐。虽然通过中心性指标进行重要医生挖掘，但挖掘效果有提升空间。相似文献

3.

基于LDA主题模型的微博标签生成研究

下载免费PDF全文

熊回香叶佳鑫《情报科学》2018,36(10):7-12

【目的/意义】为微博用户生成质量较高的标签,帮助用户对微博特征进行描述。【方法/过程】首先,分析微博的特征建立候选标签与候选词表。随后,用 LDA对用户的微博进行主题分析,将用户的微博与预选标签相匹配, 生成预选标签。最后,用 LDA对用户关注的人及用户的粉丝的微博进行主题分析,对预选标签进行控制生成最终标签。【结果/结论】实验结果表明,本文以 LDA为基础提出的标签生成方法具有不错的效果,最终生成的标签能够较为准确地描述用户的微博特征。相似文献

4.

基于主题图的在线健康信息标签语义挖掘研究

下载免费PDF全文

占泚熊回香蒋武轩李琰《情报科学》2022,39(1):121-129

【目的/意义】在线健康信息的有效组织对提升全民身体素质具有重要的社会价值。【方法/过程】在分析健康信息主题、关联关系和资源标引的基础上,构建基于主题图的在线健康信息标签语义挖掘模型,从而构建了健康信息标签主题图并实现了其可视化导航、浏览和检索等功能。【结果/结论】基于主题图的在线健康信息标签语义挖掘模型能够准确的发现在线健康信息与信息标签间的深层关系,可以更好地揭示在线健康信息标签的语义关联, 为用户提供信息的可视化浏览和导航功能、提升健康信息的组织效果,帮助用户健康信息获取。【创新/局限】本文将主题图与健康信息标签相结合,提高了健康信息的检索效率和利用效率,但本文也存在着不足,例如标签样本量和样本范围较小,缺乏专业医学研究者的参与。相似文献

5.

基于用户画像和视频兴趣标签的个性化推荐

下载免费PDF全文

吴剑云胥明珠《情报科学》2021,39(1):128-134

【目的/意义】用户画像深刻地描述了视频用户的个体和群体行为特征,为视频的个性化推荐服务提供参考。【方法/过程】通过文本挖掘对爬取的视频、用户及其观影数据分析,构建单个用户画像,并通过K-Means和LDA 模型对用户聚类并提取主题,挖掘群体用户特征。基于用户画像和时间指数衰减的视频兴趣标签,并结合视频喜爱度和协同过滤,进行视频推荐。【结果/结论】考虑时间指数衰减的个性化推荐,提高了系统对用户兴趣的感知。结合视频喜爱度和协同过滤,推荐视频评分达0.87,有助于提高用户对网站的忠诚度和活跃度。【创新/局限】基于用户生成内容的文本挖掘结果,进行单个和群体用户画像,并创新性采用时间指数衰减构建用户视频兴趣标签,以捕获用户兴趣的变化。由于网络爬虫的限制,实验数据量有一定的局限性,且特征提取兴趣范围有限。相似文献

6.

信任视角下基于文本图片多源信息的在线择医行为研究

下载免费PDF全文

易梦馨吴江蔡婧璇高嘉慧《情报科学》2021,39(9):84-93

【目的/意义】研究在线医疗社区医生主页中的医生文本信息与图片信息对患者择医行为的影响,期望为患者在线择医行为的研究提供更深入的多源信息融合方面的理论依据,并为提高在线问诊的服务质量提供参考意见。【方法/过程】本文以信任源理论为基础,从影响信任的声誉可信度、能力可信度和面孔可信度三个维度出发构建患者在线择医模型,收集春雨医生网站文本、图片和其他相关信息,基于深度学习,识别医生照片中的面孔特征, 并基于多源信息,通过回归分析验证理论模型。【结果/结论】医生的声誉可信度对患者择医行为有显著的正向影响,而医生的能力可信度负向影响着患者的择医行为。照片信息方面,严肃、不出众的医生外观形象能够促进患者对医生的信任,进而正向影响患者的择医行为,照片的面孔吸引力可以削弱医院等级带来的负面影响。【创新/局限】本文将图片信息加入患者择医决策行为研究中,充分考虑了患者生成信息与系统生成信息对患者择医行为的影响。相似文献

7.

基于特征分析和标签提取的医生画像构建研究

下载免费PDF全文

唐晓波高和璇《情报科学》2020,38(5):3-10

【目的/意义】医生同时兼具提供医疗服务的社会工作者和从事科学研究的科研工作者双重身份,因而需要从更全面、立体的角度组织管理和利用互联网中多源的医生数据用来构建医生画像,对于患者寻求医疗救助、提高健康服务质量具有重要作用。【方法/过程】在提出医生画像概念的基础上,以医院官网、百科类网站、文献数据库、在线健康社区等数据源为基础,提出基于特征分析和标签提取的医生画像构建模型,分别从医生的人口统计属性、简介特长、科研成果、科研合作、患者在线评价五个方面构建医生画像,最后在此基础上进行实证研究,以可视化的方式展示医生画像。【结果/结论】基于特征分析和标签提取的医生画像构建模型能够全面描述医生信息并将其以更加直观的形式展示出来,从而推动为患者提供个性化的健康服务和精准的医生推荐等研究的发展。相似文献

8.

基于先验知识TextRank的学术文本关键词抽取

下载免费PDF全文

方俊伟崔浩冉贺国秀陆伟《情报科学》2019,37(3):75-80

【目的/意义】学术文本关键词抽取是从文本中自动抽取具有主题性、代表性的词或短语,是学术信息服务的重要环节。传统的方法大多仅依靠候选关键词有限的词频、文档频率等统计信息,没有考虑学术文本内候选关键词在对应学术领域的使用情况,使得关键词抽取的准确率受到限制。针对这一问题,本文提出一种基于先验知识TextRank的学术文本关键词抽取算法。【方法/过程】首先计算候选关键词的使用情况作为先验概率特征值,然后运用基于图排序的关键词抽取算法TextRank计算候选关键词的文本内特征值,最后结合以上两个特征计算得到候选关键词的综合权值并对关键词进行排序。【结果/结论】在计算机科学领域的多个文献集上进行了实验评估,其结果相较于传统的关键词抽取方法有了明显的提高,证明了基于先验知识TextRank的学术文本关键词抽取算法的有效性。相似文献

9.

基于CNN和SOM的评论主题发现

下载免费PDF全文

谢宗彦黎巎周纯洁《情报科学》2018,36(6):30-34

【目的/意义】随着旅游网站的增加,游客的网络评论日益增多。针对传统方法在旅游短文本评论主题分类时出现特征维度过高和数据稀疏等问题,本文提出一种基于卷积神经网络和 SOM的旅游评论主题发现方法。【方法/过程】首先采用词向量来进行文本表示,降低了特征维度过高问题;其次,通过卷积神经网络对评论文本提取高阶的抽象特征;最后在通过 SOM 模型基于提取到的抽象特征对主题进行聚类。【结果/结论】实验结果表明, CNN-SOM算法较传统文本聚类算法在准确率、召回率和 F值上都有显著提高,能够更好的进行旅游评论的主题发现。相似文献

10.

5G环境下高校图书馆自媒体平台多标签文本分类方法研究

下载免费PDF全文

程雅倩黄玮金晓祥贾佳《情报科学》2022,39(2):155-161

【目的/意义】由于自媒体平台中的多标签文本具有高维性和不平衡性,导致文本分类效果较差,因此通过研究5G环境下高校图书馆自媒体平台多标签文本分类方法对解决该问题具有重要意义。【方法/过程】本文首先通过对采集的5G环境下高校图书馆自媒体平台多标签文本进行预处理,包括无意义数据去除、文本分词以及去停用词等;然后采用改进主成分分析方法进行多标签文本降维处理,利用向量空间模型实现文本平衡化处理;最后以处理后的文本为基础,采用Adaboost和SVM两种算法构建文本分类器,实现多标签文本分类。【结果/结论】实验结果表明,本文拟定的自媒体平台标签文本分类方法可以使汉明损失降低,F1值提高,多标签文本分类效果好,且耗时较低,具有可靠性。【创新/局限】由于本研究中的数据集数量不够多,所以在测试和验证方面,得出的结果具有一定局限性。因此在未来研究中期望利用更为丰富的数据库,对所设计的方法做出进一步的改进与创新。相似文献

11.

网络用户在线评论的主题图谱构建及可视化研究——以酒店用户评论为例

下载免费PDF全文

邢云菲曹高辉陶然《情报科学》2021,39(9):101-109

【目的/意义】网络用户在线评论是用户对某产品或服务机构体验感知的反馈,对网络用户在线评论的文本挖掘是情报分析的重要内容。【方法/过程】为了更有效从海量网络用户在线评论文本中挖掘用户感兴趣的信息, 本研究爬取TripAdvisor网站四大城市的酒店用户在线评论,基于主题图谱理论和文本聚类算法构建网络用户在线评论的聚类模型,通过图谱可视化揭示不同地区酒店用户观点差异,并分析不同图谱的社会网络特征。【结果/结论】研究发现酒店用户最关注的是服务,其次是酒店的环境和位置。本研究能够快速挖掘酒店用户关注内容,对帮助酒店管理者了解用户住宿需求并以此提高用户满意度具有重要价值。【创新/局限】本文结合主题图谱和文本挖掘技术构建酒店用户在线评论主题图谱,在大数据文本主题聚类上显示出优越性。但本文仅分析TripAdvisor网站四个城市中部分酒店的用户在线评论,数据面覆盖不够广泛。相似文献

12.

不同就医情境下在线健康社区用户信息需求偏好研究 ——以寻医问药网“有问必答”社区为例

下载免费PDF全文

易明姚玉佳李佳奇李帅珂《情报科学》2023,41(1):9-16

【目的/意义】在线健康社区可持续发展的关键在于知识共创。用户信息需求作为知识共创的起点,是开展在线健康社区知识共创机理研究的重要基础。【方法/过程】首先从就医渠道、就医状态、治疗现状3个维度刻画在线健康社区的用户就医情境,提出4类就医情境。其次运用python爬取寻医问药网“有问必答”社区2020年全年用户有效提问数据97169条,通过独立编码为其打上就医情境标签。最后融合Word2vec与LDA算法,提取不同就医情境下用户信息需求偏好。【结果/结论】研究发现,30.1%的用户不能准确描述就医情境。在准确表达就医情境的用户中,线上初诊是主要就医情境,主要关注症状与就诊;线下初诊+未治疗+线上复诊主要关注检查与原因;线下初诊+治疗过+线上复诊主要关注方法效果与后续;线上初诊+治疗过+线上复诊主要关注方法效果与后续。【创新/局限】本文依据疾病就诊与治疗的全过程提出4类就医情境,并揭示了不同就医情境下用户信息需求偏好差异,但仅对医患类在线健康社区进行了实证分析。相似文献

13.

突发公共卫生事件情境下在线健康社区用户画像与分群研究 总被引：1，自引：0，他引：1

下载免费PDF全文

王帅《情报科学》2022,40(6):98-107

【目的/意义】在突发公共卫生事件情境下面向在线健康社区用户画像与分群,有助于提升社区服务质量,为拓宽互联网疫情风险感知渠道作出贡献。【方法/过程】以“COVID-19”为例,结合社区数据特点从用户基本特征、用户兴趣主题、情感倾向、用户问诊需求和用户交互网络角色五个角度出发构建画像标签并利用DBSCAN聚类实现画像,根据画像结果呈现用户概貌;利用 AP算法在画像基础上实现用户分群,通过社会网络分析找到最具疫情风险发现价值的用户类群。【结果/结论】实例分析表明,本文所构建的模型能够有效生成在线健康社区用户画像, 画像可以对社区用户进行概括、映射用户原貌;分群结果呈现出5类社区用户群：患者、疑似患者、医师、奉献者和社区管理员;社会网络分析表明最具疫情风险发现价值的用户群体为疑似患者和奉献者。【创新/局限】实例分析数据量尚达不到“大数据”标准,画像构建粒度仍有继续提升的空间。相似文献

14.

网络健康社区中健康信息传播网络及主题特征研究

下载免费PDF全文

范昊张玉晨吴川徽《情报科学》2021,39(1):4-12

【目的/意义】本文利用用户在健康信息问答过程中产生的真实数据,从网络结构和信息主题两个维度对网络健康社区中的健康信息传播网络及主题特征进行研究,进而为社区的建设和维护提供建议。【方法/过程】首先, 利用社会网络分析法对不同时间阶段的健康信息传播网络进行指标测度和可视化呈现,探究其网络结构特征;然后结合LDA和已有词表,对社区内健康信息进行主题识别和提取,分析健康信息主题的分布及其变化趋势。【结果/ 结论】本研究发现实验选取的网络健康社区内部的健康信息传播网络具有小世界效应,用户流动性大,关键节点变更快;用户健康信息问答的内容集中在若干主题,且部分主题随时间呈现一定变化趋势。【创新/局限】网络健康信息的生成和传播源于用户之间的信息交互。本文从网络结构和信息主题两个维度开展研究,更符合其内部机理, 研究更加深入和具象;网络健康社区种类众多,本文只选择其中一个社区进行研究,可能存在一定的局限性。相似文献

15.

基于多采样双向编码表示的网络舆情主题识别研究

下载免费PDF全文

孙靖超刘为军《情报科学》2021,39(7):147-152

【目的/意义】舆情主题识别一直是舆情领域的研究热点,如今已有丰富的研究成果。现有研究对舆情信息进行表征时多采用了传统的词袋模型、主题模型或词向量模型,只能对词语进行唯一的向量表征且传统模型需对文本分词,可能会因分词错误、数据稀疏、出现集外词等情况影响识别效果。【方法/过程】本文构建了一种基于多采样双向编码表示的网络舆情主题识别模型,在训练前无需对文本进行分词,针对文本过长的情况采用头尾结合的方式进行截断,从字、段、位置三个维度提取特征嵌入,通过自注意力机制进行舆情表征,在训练过程中使用区分性微调和多采样dropout的方法增强泛化能力,提升识别效果。【结果/结论】实验结果表明构建模型在舆情主题分类任务中表现良好,可以在不对文本分词的情况下实现对舆情主题的准确识别。【创新/局限】创新之处在于构建了一种新型的网络主题识别模型,局限之处在于算法复杂,如何进一步调参优化是接下来的研究重点。相似文献