共查询到20条相似文献,搜索用时 0 毫秒
1.
进入Web2.0时代,大众分类成为其中一种主要的信息组织方式之一,而大众分类则是通过标签系统实现对网络信息资源的分类,因此标签在大众分类中占据重要地位。以豆瓣网中的"豆瓣电影"为例,分析标签检索存在的局限,并提出对应的优化方法和措施。 相似文献
2.
[研究目的]为实现科技政策文本内容的自动编码与多主题分类,探索一种融合BERT模型和多尺度CNN模型的多标签分类方法,得到更加丰富的政策语义特征信息。[研究方法]针对科技政策内容句的信息密度大、内涵分布不均衡等特点,通过BERT充分提取政策内容的上下文信息,增强文本的语义特征表示;然后利用多尺度、多通道的CNN-Inception模块提取更多尺度的特征,通过捕获文本的局部特征与组合不同尺度的语句特征,提升模型在多标签分类任务上的性能。[研究结论]对比实验表明,与单一BERT分类模型相比,文中提出的BERT-多尺度CNN模型的召回率与Micro-F1值显著提高,提升了科技政策多标签分类的效果。 相似文献
3.
在线健康社区用户信息需求的层级多标签分类研究 总被引:1,自引:0,他引:1
[目的/意义]用户健康信息需求研究能够发现用户潜在需求,解决用户健康信息盲区,帮助用户实现更好的自我健康管理。研究目标为挖掘识别用户信息需求主题,提取用户特征,促进完善网络社区交互性与多元性发展,为更好地改善健康信息服务提出建议与意见。[方法/过程]针对在线健康社区的母婴群体,提出在线健康社区用户信息需求层级多标签分类模型。通过扎根理论提出在线健康社区用户信息需求主题体系,利用ALBERT对母婴健康需求类数据进行预训练,使用双向GRU与注意力机制构建基础分类器,以此来构建层级多标签分类模型Multi-BiGRU-Attention,实现在线健康社区提问数据的层级多标签分类。[结果/结论]实验对比发现,随着层级的增加,研究提出的模型相比于单层的基础分类器BiGRU-Attention在micro-Precision, micro-Recall, micro-F1等各项指标上均有所提升,说明该模型的层级结构信息能够一定程度上改善模型效果;相比于层级多标签相关模型,在各项指标上均有所提升,说明该模型存在一定的适用性与扩展性。 相似文献
4.
网络信息分类检索问题研究 总被引:4,自引:0,他引:4
This paper studies network information classification retrieval from the theory of information management. With a brief introduction to search engines, it focuses on analyzing the characteristics of network documents and their classification system. Problems in network document classification are pointed out. Suggestions such as constructing a catalog classification search engine system are made. 相似文献
5.
6.
7.
提出一种基于多Agent协作架构的自动分类知识库更新思路,通过多Agent协作新文档与已有训练规则的匹配,有效地进行新类别的自动扩展和新分类规则的自动生成,同时为训练集的频繁维护问题提出了新的解决方案。 相似文献
8.
【目的/意义】由于自媒体平台中的多标签文本具有高维性和不平衡性,导致文本分类效果较差,因此通过
研究5G环境下高校图书馆自媒体平台多标签文本分类方法对解决该问题具有重要意义。【方法/过程】本文首先通
过对采集的5G环境下高校图书馆自媒体平台多标签文本进行预处理,包括无意义数据去除、文本分词以及去停用
词等;然后采用改进主成分分析方法进行多标签文本降维处理,利用向量空间模型实现文本平衡化处理;最后以处
理后的文本为基础,采用Adaboost和SVM两种算法构建文本分类器,实现多标签文本分类。【结果/结论】实验结果
表明,本文拟定的自媒体平台标签文本分类方法可以使汉明损失降低,F1值提高,多标签文本分类效果好,且耗时
较低,具有可靠性。【创新/局限】由于本研究中的数据集数量不够多,所以在测试和验证方面,得出的结果具有一定
局限性。因此在未来研究中期望利用更为丰富的数据库,对所设计的方法做出进一步的改进与创新。 相似文献
9.
采用访谈和问卷研究法,对大学生网络依赖问题进行研究。我们的研究显示:重度网络成瘾的学生只占1.2%,有网络依赖和网络成瘾的学生共占8.0%~8.8%。网络成瘾性别差异极其显著,男生成瘾性高于女生。其中大一学生网络成瘾性高于大二,大三学生比大二学生网络成瘾性高。在二年级中,理科学生上网成瘾却是最高。 相似文献
10.
基于权力依赖的技术创新网络核心企业的识别研究 总被引:1,自引:0,他引:1
首先在深度访谈的基础上设计并发放调查问卷;随后借助spss14.0和amos4.0统计分析软件对问卷数据进行处理,利用EFA构建了技术创新网络核心企业识别概念模型;紧接着利用CFA和Cronbach alpha系数对识别因子的有效性以及识别模型的信度和效度进行了检验。研究结果认为网络结构核心性、网络敏感性和网络脆弱性是识别技术创新网络中核心企业的三个主因子。 相似文献
11.
网络技术的发展与普及,对大学生的思想政治观念、价值取向等诸多方面产生越来越广泛而深刻的影响。给高校学生思想政治工作带来严峻的挑战。通过对大学生网络依赖心理的分析,提出了解决网络依赖心理的对策和方法,为大学生全面发展和有效开展高校思想政治教育创造条件。 相似文献
12.
Web2.0中社会性标签系统的复杂网络特性研究 总被引:1,自引:0,他引:1
Web2.0已经成为新一代互联网应用的发展趋势。Web2.0系统中存在着大量的非线性、自组织和涌现等具有复杂系统特性的现象。本文研究Web2.0的一个典型应用——社会性标签系统的复杂网络特性。 相似文献
13.
14.
网络文本分类是数据挖掘技术的重要组成部分,是从互联网中获取有效信息资源的重要方式之一.本文论述了网络文本分类及其技术,通过对具有主题的大量网络文本的有效分析和挖掘,使网络文本分类技术在自主网络信息定制和自动信息获取中得到更加广泛地应用研究. 相似文献
15.
进入信息时代,信息技术与互联网得到迅猛发展。信息资源已实现从文字到图片到视频的转变与普及。相对于文本与图像,视频所涵盖的内容更加丰富,表达信息更为直接。本研究从用户信息行为领域入手,立足于国内外研究者涉足较浅的视频检索领域,通过调查大学生群体对网络视频的检索与浏览行为的相关内容,分析该群体对网络视频检索与浏览行为的相关原因进行研究。 相似文献
16.
【目的/意义】通过对大数据环境下的多源用户兴趣特征有效融合,缓解个性化推荐中用户兴趣偏好数据的稀疏性和准确性问题。【方法/过程】考虑到多域的数据权威度、内容质量及体系结构的差异化较为明显,提出了基于多源用户标签的跨域兴趣融合模型,首先把多个域中的用户兴趣进行标签化处理,然后利用跨域用户识别和标签权重归一方法得到多个域的用户实体-标签矩阵,最后使用域权重影响系数对标签进行融合,构造具有复合权重的用户兴趣标签集。【结果/结论】使用5个来源数据域进行实验与分析,融合模型能够有效提高标签用户覆盖效果,在查全率不断提高的情况,融合域能够保持较高的标签用户查准率,有效提高用户兴趣特征的描绘效果。 相似文献
17.
18.
基于面向主题和面向分类相结合的搜索引擎 总被引:2,自引:0,他引:2
搜索引擎已经成为互联网信息检索的主体,然而,它的查全率,特别是查准率却比较低,原因主要在于两方面,一个是技术原因,另一个是搜索引擎和用户的接口界面设计上存在障碍,使得用户无法有效地根据搜索引擎的提示调整检索策略,搜索引擎也无法以一种方便用户操作的合理方式来展示查询结果。分类目录和主题检索的联合方法是在现有技术条件下解决此问题的有效途径。 相似文献
19.
在分析现有网络信息组织方法的基础上,提出了基于分类、主题、自然语言的网络信息资源组织与检索的三种模式,并指出无论那种方式都需实现用户界面的可视与智能。 相似文献
20.
目前社会标签广泛应用于互联网各类型网站。为了对国内外各类型网站标签应用和功能情况有较全面的了解,也为了在此基础上对标签进一步应用和功能发掘,文章在实际调查的基础上,整理分析出当前国内外各类型网站中标签的实际应用情况,并对标签的基本功能和扩展功能进行了详细论述。 相似文献