排序方式: 共有60条查询结果,搜索用时 15 毫秒
1.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。 相似文献
2.
[目的/意义] 针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程] 以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论] 在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。 相似文献
3.
k-clique社区知识创新演化方法研究 总被引:3,自引:0,他引:3
提出一种基于k-clique社区的知识创新演化揭示方法。首先,构建科技文献时序关键词共词网络。然后,将共词网络划分为n个最大完整子网络Gs,在Gs中寻找k-clique(2 < k < s)。最后,在给定阈值k的情况下,计算k-clique社区的演化情况,从而揭示知识创新情况。该方法不仅能够有效揭示知识创新演化过程,而且能够通过k-clique社区的关键节点,揭示知识创新过程中的共性知识以及不同知识创新领域的互相影响情况。通过对碳纳米管研究领域2008-2012年SCI数据库论文数据的实验证明,该方法能准确识别出该领域知识创新主要方向,并能准确反映其演化情况。 相似文献
4.
[目的/意义]分析科技创新路径识别研究中用到的主要研究方法与开源工具,提出利用引文内容挖掘实现科技创新路径识别方法及开源工具。[方法/过程]首先,基于引文分析、结构洞分析、凝聚子群分析、文本内容挖掘、引文内容挖掘等不同角度分析了科技创新路径识别的主要方法;其次,从数据源、文本格式、挖掘内容、处理能力等方面阐述了用于实现引文内容挖掘的科技创新路径识别的3个开源工具:Mallet、Knime、NLTK;最后,分析了实现科技创新路径可视化的5个开源工具:Pajek、Ucinet、Gephi、D3.js、VOSViewer。[结果/结论]通过研究发现,利用开源工具深入挖掘引文内容中蕴含的丰富语义信息,识别不同引用动机,进而进行可视化展示可以有效的实现科技创新路径表达。 相似文献
5.
[目的/意义]当前生成式人工智能的发展对社会产生了强烈冲击。为响应国家创新发展的迫切需求,如何利用生成式人工智能更好地完成情报工作,以满足用户的情报需求,已成为当前情报学领域关注的热点问题。[方法/过程]基于供需理论提出从数据供给侧(Supply)、智慧情报分析中台(Analysis)、情报需求侧(Demand)三方构建生成式人工智能赋能情报工作范式模型——SAD范式模型,深入分析生成式人工智能赋能情报工作机理,并结合国际前沿项目案例探讨生成式人工智能与情报工作的前瞻性融合发展。[结果/结论]生成式人工智能赋能情报工作范式模型SAD,可以更好地促进生成式人工智能赋能情报工作的各个环节,提高情报工作效率,为情报工作范式研究提供了新思路。 相似文献
6.
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究.通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究.进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律.最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率.通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用. 相似文献
7.
[目的/意义]从主题视角对环境科学领域的零被引论文进行分析,对比零被引论文与高被引论文在文章内容、外在指标方面的不同,揭示零被引论文存在的原因。[方法/过程]首先,对来自Web of Science数据库的国内环境科学领域的260篇高被引论文、907篇零被引论文的摘要进行PLDA主题识别,然后通过主题相似度计算发现主题间的关联,以主题热度作为内部指标,发文时间、发文期刊作为外部评价指标,最后,把论文主题内容与外部指标结合进行零被引与高被引论文之间的相同主题、不同主题对比分析。[结果/结论]在研究主题相同情况下,期刊的影响因子大小是影响零被引论文的主要因素;在主题不同的情况下,论文研究的主题内容是导致零被引论文的主要原因。 相似文献
8.
[目的/意义] 提出利用数字技术来追溯现代精神文明的古典参照,试图探寻我国精神文化建设的可靠历史依据,树立坚定的文化自信。[方法/过程] 以稷下学派为例,收集现代期刊论文和古代史书典籍,利用机器学习和自然语言处理技术构建古今思想文化的对比映射框架。分别通过古今文本的特征表示、主题聚类和思想聚合,实现现代文明对于古典思想的参照,并从治国理政、经济建设、法治思想、教育思想、生态环境等5个方面进行深入分析。[结果/结论] 分析表明,现代精神文明与古典文化意识既相通又存在差异。现代的孝道、德治思想在稷下思想中都有所体现。现代教育体系中的素质教育、思想教育能够追溯到古典精神中品德教化踪迹。古今的法制建设在观念上趋同,但在形式上存在差异。经济建设体系的不同也影响了生态建设观念的差异。本研究的设计与实现初步展示现代数字技术对于映射古今思想对照的可行性,为数字人文中的精神思想挖掘提供新思路,尤其对于追寻我国现代文明建设的历史依据具有重要的现实意义。 相似文献
9.
[目的/意义] 稷下思想是先秦百家争鸣时期的沧海遗珠,研究如何从稷下研究文献中自动识别出稷下思想,为稷下学数字人文研究提供方法基础。[方法/过程] 选取《管子学刊》作为研究数据源,对其收录的部分文本进行11大类附属42小类的思想类别归纳,构建训练数据集,提出一种基于ERNIE微调的JixiaERNIE模型,将稷下思想自动识别映射为文本自动分类问题,利用模型进行自动分类识别。[结果/结论] 通过实验对比得出,构建的JixiaERNIE模型在学习率4e-5、迭代次数为10分类效果达到最优,与基线模型相比,F值提高了7.9%。为进一步增强模型识别分类效果,在模型连接层的基础上加入分类器对比,有效实现面向数字人文研究的稷下思想自动分类任务。 相似文献
10.
[目的/意义] 根据基金项目数据的特点,提出基于基金项目数据的研究前沿主题探测方法,以期识别出前瞻价值更高的研究前沿,为研究前沿识别相关研究提供借鉴思路。[方法/过程] 首先,基于PLDA模型识别蕴含在基金项目文本中的研究主题;然后基于主题-文档矩阵建立主题和基金项目文档的映射关系,在此基础上,利用主题的资助时间、资助金额和中心性指标进行研究前沿主题探测,从而识别出值得关注的研究前沿主题;最后,利用主题演化可视化分析方法,对研究前沿主题进行演化分析,以预测其发展趋势。[结果/结论] 研究结果表明,该方法可以根据基金项目数据的特点识别出蕴含在其中的研究前沿主题,并且能够分析研究前沿主题的分裂、融合等演化过程。 相似文献