首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 889 毫秒
1.
阿柔娜 《情报科学》2023,(5):153-160
【目的/意义】分析数据隐私风险的时序主题关联,理清热点主题的演化路径,探索有温度的数据隐私风险治理。【方法/过程】基于WOS核心合集和Scopus数据库收录的数据隐私风险领域相关文献,通过LDA主题模型将文本按照时间片切分,并识别各时间片的研究主题;再通过余弦相似度计算分析相邻时间片主题的时序关联,梳理主题演化路径并探索研究前沿。【结果/结论】数据隐私风险研究的关注点逐渐从对识别、评估和缓解数据隐私风险技术本身的关注,转向对平台、算法和场景整体性情境的关注,这需要通过数字伦理、法律和社会等方面共同助力形成负责任的技术,以期构建数字信任环境。【创新/局限】本研究对跨学科和跨领域的数据隐私风险研究的演化路径进行梳理,探索数据隐私风险治理的有效路径。未来可进一步细化不同时期的主题,并深入分析不同时间片的新兴技术对数据隐私风险的影响。  相似文献   

2.
【目的/意义】构建主题-主题关联的学科知识网络,从主题之间语义关联角度度量主题在学科知识网络中 的影响力,分析学科知识结构演化规律,为热点、前沿主题探测提供方法支撑。【方法/过程】基于 LDA主题模型抽取 学科领域研究主题,利用主题在科学文献中的共现关系构建主题-主题关联的学科知识网络,并提出主题影响力概 念和度量方法;基于复杂网络结构分析方法对学科领域生命周期内主题-主题关联的学科知识网络进行演化分 析。【结果/结论】实证分析表明主题的网络影响力是主题强度、被学者关注度等外部特征指标的有力补充,可用来 探测热点、前沿主题。同时,学科知识结构随着学科领域的发展表现出较强的小世界网络特征。  相似文献   

3.
张雷  谭慧雯  张璇  韩龙 《情报科学》2022,40(3):144-151
【目的/意义】构建高校师德舆情微博用户评论LDA模型,可以更精准识别舆情演化特征和分析关键主题传 播路径,帮助高校和相关部门更为有效地进行舆情监管和舆情引导。【方法/过程】本文以“天津大学一教授学术造 假”事件为例,基于 LDA模型构建高校师德舆情下微博用户主题生成模型,采用困惑度评价指标确定 LDA模型最 优主题数,采用信息熵确定每一主题在不同日期的主题强度,通过关键词共现知识图谱、词云展现舆情话题的演 变,最后基于主题相似度确定主题传播路径。【结果/结论】LDA模型和信息熵可以解析出网络用户群体关注的重要 主题热点,精准识别舆情演化特征,识别主题最优传播路径进行舆论引导,对爆发的舆情实现预测和管制优化。【创 新/局限】文章创新性地构建高校学术道德舆情的LDA主题模型,有效确定微博用户群体主题、识别舆情演化特征、 分析主题间传播路径,具有普适性;进一步扩大高校师德其他舆情分析及结合网络舆情情感分析为下一步的研究 内容。  相似文献   

4.
【目的/意义】针对学术APP评论数据特征,挖掘用户评论语义关联关系,为平台运营者和开发者高效获取 用户需求和关注点提供思路和指导方法。【方法/过程】首先,基于LDA主题模型和GloVe 词向量模型构建学术APP 用户在线评论主题语义关联研究框架,然后,采集超星移动图书馆APP在线评论作为样本数据,通过主题识别获取 用户评论主题并基于词向量相似性得到主题语义关联,最后构建出语义关联主题图谱。【结果/结论】实验结果表明 运用文章提出的思路方法能够有效发现用户评论主题和主题间关联关系并得到主题关联图谱,从而为学术APP平 台运营者完善平台功能提供参考和借鉴。  相似文献   

5.
高楠  高嘉骐  陈洪璞 《情报科学》2023,(3):127-135+172
【目的/意义】通过综合使用论文和专利数据源,开展新兴技术的识别与演化路径方法研究,期望以此提高学科领域新兴技术探测研究的准确性和科学性。【方法/过程】首先,针对集成电路这一特定领域使用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,并利用LDA主题模型发现并识别集成电路领域隐含的技术主题,构建新颖度、强度和热度等多维指标对新兴技术进行对比和甄别。其次,划分时间窗,采用余弦相似度算法计算相邻时间窗内主题间的相似性,以可视化路径的形式将筛选结果进行呈现,以此判断主题演化关系类型。【结果/结论】研究发现,集成电路领域呈现学界与业界研究成果相互促进的良好态势,结合论文与专利数据的新兴技术识别方法,可以有效且清晰的发现集成电路研究领域的热点型、增长型、成熟型和潜在型技术主题,并通过新兴技术演化路径的构建,揭示了领域科学与技术间知识的交互与转移。【创新/局限】本研究创新性采用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,提高了词袋构建质量,为后续基于LDA主题模型识别隐含的技术主题奠定了基础,但在数据源的多样性、时滞性问题,以及模型阈值设置的客观性上还存在局限性,需要...  相似文献   

6.
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和 LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理 数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题 分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结 论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的 主题演化信息;在同一时段LDA模型分析对语义关系模糊逻辑结构粗糙的文本提取正确主题的效果明显优于共词 分析。  相似文献   

7.
朱晓峰  葛锐  蒋勋 《情报科学》2022,39(1):109-120
【目的/意义】数字时代“开放政府数据”热潮产出了丰硕成果,对其研究主题结构和演化脉络进行全面、精 准的可视化揭示,有助于进一步丰富和完善该领域研究,科学地指导我国实践开展。【方法/过程】以 2000-2019 年 WOS数据库中“开放政府数据”主题文献为基础,借助新型SLM算法探测主题社区,梳理研究主题分布;同时嵌入 SNA方法,引入“传导率”指标定量评估主题社区成熟度和内外部关联,并利用Cortext平台构建时序演进过程。【结 果/结论】国外开放政府数据研究已形成四类主题社区:健康社区、开放数据社区、管理社区以及安全社区,目前仍 存在“主题遍布粒度不够细化、新兴主题社区亟需成长、演化脉络断续明显”等问题。【创新/局限】嵌入新型算法 SLM 划分主题社区,结合 LDA 模型对国外 OGD 研究主题关联与演化进行了完整阐释。但本文仅选取 WOS核心 库的相关主题文献作为数据源,存在进一步扩充的空间。  相似文献   

8.
【目的/意义】云计算的普及使得MI学科受到学术界的持续关注,对MI主题识别与演化的分析可以揭示历史演化,有助于发现人们关注的问题,预见该领域的未来发展。【方法/过程】本文利用潜狄利克雷分配(Latent Dirichlet Allocation, LDA)主题模型对web of science(WOS)数据库中与MI相关的主题进行识别和挖掘,并利用生命周期理论、变异系数法、Kullback-Leibler divergence(KL)等理论和方法绘制出MI研究主题的演化路径。【结果/结论】研究结果表明,MI的研究主题正逐渐向方法、技术和实践的研究方向发展,医疗数据分析、临床数据挖掘、健康信息技术等新兴技术和应用方向将成为未来MI学科的研究热点。【创新/局限】本文从生命周期视角对全球范围内医学信息学学科的主题演化进行挖掘和分析,为该学科未来的发展提供借鉴,但并没对各地区分别进行分析,因此存在一定的局限性。  相似文献   

9.
【目的/意义】学科领域的研究前沿是科学研究的重点。鉴于识别研究前沿中缺乏将用户需求信息和发文 趋势结合的现况,本文提出基于引文量与发文量,利用Z分数与Sen’ s斜率的研究前沿识别方法。【方法/过程】利用 LDA模型提取学科领域的研究主题,以Z分数代表研究主题的活跃度,Sen’ s斜率代表研究主题的发文趋势,以图书 馆学领域为例,分析其研究主题在2012-2017年的发文量与引文量,实现对该领域研究前沿的识别。【结果/结论】图 书馆学领域的前沿主题有图书馆网络化与自动化、阅读推广、公共文化事业、信息资源建设与知识管理等。通过与 Citespace突发检测法相比,证明本文提出的方法在识别学科领域研究前沿时更全面。  相似文献   

10.
【目的/意义】随着LDA模型成为微博信息推荐的主要工具,众多的LDA演化模型的使用问题成为研究者 亟待解决地问题。【方法/过程】首先,从演化发展角度对LDA模型运行机理进行了解析,揭示了模型使用的先决条 件和算法内涵;其次,从不同需求的视角揭示了RB-LDA、RT-LDA、C-LDA、MB-LDA等扩展模型对LDA模型的 功能性补充;最后,提出LDA模型的技术演化方向。【结果/结论】结果表明可利用微型本体来提升语义性、利用多种 模型融合来提升精度、利用大数据来提升数据质量是LDA模型未来的演化方向,可使LDA模型信息推荐能力的更 具个性化和精准化。  相似文献   

11.
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是 进行技术创新的基础情报工作,对于研究人员、企业都具有一定的意义。【方法/过程】提出基于交互式可视化技术 的知识图谱构建方法,首先基于经典LDA模型进行主题识别,然后基于社会网络分析方法构建领域主题网络识别 关键主题词;最后,基于JS(D3 工具)绘制可交互的关键主题词关联与检索知识图谱,发现关键主题词的隐含联系, 辅助进行领域知识挖掘与分析。【结果/结论】通过对我国医疗健康信息领域进行实证研究,验证了本文提出方法的 准确性和有效性。  相似文献   

12.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

13.
杨思洛  江曼 《情报科学》2023,(5):181-190
【目的/意义】对国内外新兴技术概念和识别方法进行梳理,总结对比各方法的特点和研究中存在的不足,为未来新兴技术识别研究提供多维视角和方法参考。【方法/过程】通过新兴技术与前沿技术、颠覆性技术概念辨析,明确新兴技术的内涵与特征;然后从数据源、识别路径、识别指标、有效性验证等四个层面梳理新兴技术识别方法的特点及优劣。【结果/结论】总结得出新兴技术识别的4方面数据源、2大识别路径、5类识别指标、4种有效性验证方法,未来可进一步探讨新兴技术形成机制、多源数据的融合,改进基于术语的新兴技术识别路径、更细粒度的自动化识别方法,加强识别指标与技术特征的关联解释,完善识别结果的有效性验证等。【创新/局限】全面系统对新兴技术识别方法进行归纳梳理,从主题和术语两类识别单元归纳新兴技术识别路径机理及方法模型,有利于为新兴技术识别提供不同维度的研究思路。  相似文献   

14.
徐路路  王芳 《情报科学》2019,37(8):22-28
【目的/意义】识别科学研究前沿主题,预测未来发展趋势。【方法/过程】首先利用主题概率模型识别出论文、 专利及基金项目多源数据中的科学前沿主题;考虑研究前沿主题演化的复杂性和非线性的特点,利用机器学习算 法和支持向量机模型预测主题发展趋势,并采用改进后的粒子群算法对模型参数进行优化,以提高传统支持向量 机模型在处理非线性、小样本等数据上的预测准确度。【结果/结论】实验对比发现,本方法对于研究前沿主题的预测 准确度较高,准确识别出石墨烯领域未来发展趋势。  相似文献   

15.
【目的/意义】当前,对学科研究前沿的挖掘和探测成为学科知识创新服务的重要支撑。本文从整合主题的 视角出发,提出了学科知识网络构建与演化分析的框架,通过该框架实现学科研究前沿的挖掘和探测。【方法/过 程】整合主题的学科知识网络构建与演化分析框架主要包括三个部分。一是,基于主题挖掘与主题语义关联计算 相结合的视角,提出了整合主题的学科知识网络构建流程;二是,基于复杂网络结构分析理论提出了整合主题的网 络结构演化分析方法,以挖掘和探测前沿主题;三是,基于复杂网络演化建模与多 agent系统仿真建模方法,提出了 整合主题的学科知识网络演化建模框架,通过演化建模探索学科知识结构的演化机理。【结果/结论】以上整合主题 的学科知识网络构建流程和演化分析、演化建模框架,形成了“主题挖掘→网络构建→结构演化→仿真建模”的研 究新思路,为学科知识创新服务提供了新的方法与工具。  相似文献   

16.
【目的/意义】热点舆情识别对社交媒体监管有重要意义,已有方法大多基于语义分析和社会网络分析技 术,忽略了信息传播中隐含的动态时序信息。【方法/过程】本文利用卷积神经网络,提取热点舆情在社交网络中的 多层次传播特征;然后与主题分析模型相结合,设计了热点舆情识别方法。本方法利用了舆情热度与其传播过程 间的潜在关联,摆脱了对语义信息和社会网络信息的过度依赖,适用于历史数据匮乏或缺失的识别场景。【结果/结 论】实验表明,本方法显著提升了热点舆情的识别精确度,具有一定适应性和可扩展性。  相似文献   

17.
【目的/意义】通过构建作者-主题关联的二模学科知识网络,度量作者在知识创新网络中的影响力,探寻 研究活跃程度高、研究范围广、潜在合作空间大的重要学者,对于科学评价学者学术影响力,挖掘热点、前沿研究主 题具有重要的指导作用。【方法/过程】基于AT主题模型抽取作者-主题关联矩阵,计算作者的研究主题强度,在此 基础上构建作者-主题关联的二模学科知识网络,利用作者在网络中的中心性指标度量作者主题关联影响力;基于 复杂网络结构分析方法对学科领域生命周期内作者-主题关联的学科知识网络进行演化分析。【结果/结论】实证分 析表明作者主题关联影响力与基于引文的学术影响力和基于社交媒体的社会影响力指标形成有力互补,可用于核 心作者以及热点、前沿主题探测。  相似文献   

18.
【目的/意义】从海量论文元数据中抽取算法术语并构建它们之间的创新演化关系,有利于对算法的有效管 理和运用,以帮助科研工作者提升研究效率、采纳前沿成果。【方法/过程】首先,以GAN算法论文摘要为语料,通过 人工标注与规则抽取相结合的方式进行算法术语标注,并利用BERT-BiLSTM-CRF模型实现算法术语的自动抽 取。然后,将建立的模型应用于LDA算法论文的被引文献元数据中抽取算法术语,依据规则判断和引文关系,从被 引内容中抽取LDA算法的创新演化路径并构建。【结果/结论】以GAN论文为实例的算法术语实验中,精确率、召回 率与F1分数分别达到了0.81、0.63与0.71,并应用关系抽取方法成功构建了LDA算法的创新演化路径,该方法可以 有效推动算法进化网络构建和算法检索与追踪等方面的工作,丰富创新扩散理论的相关研究。【创新/局限】拓展了 命名实体识别技术的应用领域,为计算机算法管理提供了良好的思路。后续可优化创新演化路径的构建方法。  相似文献   

19.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

20.
齐虹 《情报科学》2021,39(6):177-184
【目的/意义】电子健康记录信息作为医学健康信息资源的重要组成部分,其共享整合问题一直是当前克服 医疗信息资源“孤岛化”现象、实现医学知识服务的重点和难点,对国外电子健康记录语义整合研究进展进行分析 综述,旨在为我国后续研究提供借鉴和参考。【方法/过程】本文运用文献调查法,以电子健康记录信息资源转化为 知识资源为主线,梳理出电子健康记录语义整合的主题框架及发展态势。【结果/结论】电子健康记录语义整合是 一个集专业性和社会性高度融合的动态知识组织过程,未来研究可能关注的问题有:医学细分专业的互操作标准 建设、语义关联方式的开放透明问题、按需提供知识服务的模式研究以及开放获取与隐私保护的利益平衡问题 等。【创新/局限】对国外近期EHR语义整合研究主题进行分析和评述,并提出研究进展中的重点和趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号