首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
传统基于统计的命名实体识别方法存在需要大量人工标注的缺陷,导致识别准确率较低。为了提升识别效果,提出一种基于条件随机场的半监督学习方法(S-CRF)对命名实体进行识别。该方法将实体识别看作序列标注问题,对少量数据进行人工标注并构建实体集,通过K-means聚类算法选取有代表性的未标注数据文本进行自动标注,采用条件随机场对语料进行训练测试。选取中文应急预案文档进行实验,该方法在各个标签上的识别效果分别达到93.52%、93.04%、95.81%。实验结果表明,该方法优于传统规则方法,能有效提高应急预案命名实体的识别效果。  相似文献   

2.
命名实体识别是自然语言处理基础任务之一。针对“数字敦煌”项目应用命名实体识别技术存在的实体边界难以确定等问题,通过构建小规模敦煌石窟专有名词数据集,对基于BERT-BiLSTM-CRF的命名实体识别基本方法,和基于Multi-digraph的词汇增强方法进行了实验对比,结果表明基本方法已具备较高的识别准确率,而基于词汇增强的方法对未登录词识别效果提升显著。最后将训练得到的模型应用于“数字敦煌”资源库命名实体识别任务,证明了方法的有效性。  相似文献   

3.
电子病历中同一医疗概念的提及形式具有多样性,阻碍了医疗数据的分析和利用,研究电子病历实体标准化具有现实意义。设计并实现了基于深度学习的电子病历实体标准化算法,使用Siamese网络架构和LSTM网络搭建模型,采用Pairwise方法训练模型,在测试集上与传统基于编辑距离的方法进行比较。对手术实体标准化的实验结果显示,深度学习算法正确率达到79.71%,比传统方法提高了17.4个百分点,表明深度学习算法在电子病历实体标准化方面具有有效性。  相似文献   

4.
弹幕是最近比较流行的在线视频评论方式,因其内容为自发用户发出,可能带有大量的不和谐性,因此如何识别弹幕中的中文文本内容,文中使用了命名实体识别方法,针对弹幕文本规范化处理和研究,通过采用 Word2vec 方法进行词向量训练,以期望达到合理识别的效果。  相似文献   

5.
首先分析了互联网文本中命名实体分布特征;然后使用UIMASDK构建一个文本分析引擎在文档中寻找命名实体,将结果写入抽取信息数据库EIDB中;最后对文本中包含的命名实体的强关联关系进行了关联分析。实验证明该框架非常有效。  相似文献   

6.
钟亮 《教育技术导刊》2017,16(8):168-170
针对百度百科这一数据源,构建了化学知识图谱。首先,利用网络爬虫技术对数据进行采集与清洗;然后,采用中文分词、实体识别、实体关系识别等技术对知识图谱构建方法进行实证性研究,可视化实验所得实体及实体关系,并对实验结果进行了相关评价测试。最后,简要阐述了知识图谱的应用领域与发展优势。研究结果表明,实体关系识别的预测准确率较高。  相似文献   

7.
针对目前机器人在工业现场对工件目标识别过程中出现的低识别率问题,提出一种基于GA寻优的LBP-HOG特征融合方法,结合SVM对工件图像进行分类识别.首先,分别运用了基本LBP算子、LBP等价模式以及LBP旋转不变模式,结合不同去噪方式,评价并选择最优的LBP算子,然后,利用LBP和HOG算子分别提取工件特征,并以组合向量方式融合两类特征.最后,利用GA寻优两类特征的融合权重,通过反复评价SVM对融合特征的识别效果,更新权重,最终得到最优权重和最优识别精度.实验结果表明,单独使用LBP和HOG的图像识别率分别为80%和84%,而GA寻优后的LBPHOG组合模型,准确率提高到了96%.  相似文献   

8.
为了提高基于表面肌电与三轴加速度信号的运动识别准确率,提出了一套多源信息融合处理的实验流程与方法。该方法利用5层离散小波变换对表面肌电信号进行分解,充分提取不同运动产生的肌电信号中各频域的特征信息;再将分解后的表面肌电信号与三轴加速度信号通过滑动窗口的方法进行特征融合,构造融合肌电与空间运动特征的特征图;最后用融合特征图对深度学习模型进行训练,并结合自动状态机进行最终运动状态的识别。实验结果表明,多源信息融合处理方法可以提高运动识别的准确性,总体识别精度分别达到了95.4%和89.2%。该方法在实时性与准确性上均有良好表现。  相似文献   

9.
为了提高彩色图像二维纹理识别能力,提出基于计算机视觉的彩色图像二维纹理识别方法。采用超分辨融合方法对彩色图像进行纹理特征检测,并在邻域内进行融合滤波处理;结合小波变换方法进行颜色分量合并和模板匹配,提取图像的关联规则像素点;根据图像颜色特征分量进行多层次融合和视觉特征重构,实现二维纹理识别。仿真结果表明,该方法在识别彩色图像二维纹理特征时准确度较高、纹理特征匹配性较好,应用优势明显。  相似文献   

10.
脱机手写体识别是字符识别中的难点之一,日文中的平假名类似于中文的手写体草书.为解决该问题,首先,针对日文平假名字符的特点提出了一种基于网格的外围特征提取方法,其次,考虑到了不同特征的分类能力的差异性,提出了一种基于支持向量机的多特征融合的识别方法,提高了识别率.最后,针对日文车牌中的6 735个平假名样本和4 145个数样本字进行了识别实验.实验结果表明,该方法的识别率可达98%左右,优于距离分类器及神经元网络的方法,具有实际应用的价值.  相似文献   

11.
在分析工程文本中命名实体实际特征的基础上,提出一种基于CRF与规则相结合的工程领域命名实体识别方法。在完善用户词典并对文本进行分词后,以短语级的粒度为原则从中确定特征,将文本交由CRF算法进行处理;分析CRF的处理结果,根据语言学规律及工程文本特点编写规则,对CRF处理结果进行优化。实验表明,该方法的全局F1值能够达到93.45。  相似文献   

12.
针对人脸识别中人脸图像的特征提取问题,提出了一种将全局特征与局部特征相融合的人脸识别方法.全局特征的提取采用主成分分析算法.主动外观模型定位58个特征点,在其中17个特征点处进行Gabor小波变换则可提取局部特征.归一化的全局匹配度(局部匹配度)可由测试图像和训练图像的全局特征(局部特征)得到.对归一化的全局匹配度和局部匹配度进行融合后,融合匹配度最大的训练图像所属的类即为识别结果.实验利用2个人脸图像数据库(AR和SJTU-IP-PR)测试该方法的识别率,结果表明该方法要优于PCA和EBGM,并且在一定的表情、光照和姿态变化的条件下是有效、稳健的.  相似文献   

13.
本文提出一种新的基于特征融合的车牌汉字识别技术.该方法首先对字符图像进行奇异值分解,然后利用奇异值和奇异向量进行特征融合,得到既包含能量特性又包含几何特性的特征向量,并结合BP神经网络分类器,应用于车牌汉字识别。仿真模拟结果表明,该方法具有很好的识别率和较低的误识率。  相似文献   

14.
为了提高肝脏CT图像正常和异常的识别率,提出了一种基于LLE特征降维及改进SVM的肝脏图像识别方法。在对采集的CT图提取感兴趣区域的颜色特征、形状特征和纹理特征,利用标准差变换和极差转换把这些特征规格化到0与1之间后,采用LLE算法对特征数据进行降维融合,并使用改进的SVM对待识别图像进行分类。实验结果表明,对多类特征进行降维融合比仅用单类特征能更好地表达感兴趣区域的内容信息,LLE算法较其他流形学习算法表现出更强的鲁棒性,改进的混合核函数SVM较单一核函数SVM识别率要高。该方法可以为医生辅助诊断提供参考。  相似文献   

15.
藏区地名包含五种主要命名法的特点,通过对其所蕴含的文化含义进行介绍和诠释,将之分为自然资源和地理实体颜色等特征的地名;描述地理位置、形状的地名;反映民族的崇尚心理和宗教信仰的地名;反映历史事件、军事活动等情况的地名和以部族名、人名、动植物名等命名的地名五类。  相似文献   

16.
目前大数据融合技术都是在静态单模态数据集上进行的,没有关注大规模数据的多源、异构、不确定和跨语言特性,而西藏畜牧业领域大数据是多源、异构、跨语言的多模态数据。为此,给出西藏畜牧业领域大数据融合技术架构,提出属性聚类的异构数据源模式对齐,基于领域特征的多模态实体链接,面向开放模式实体语义关系挖掘的大数据融合技术,以及基于多模态特征的知识表示和建模、面向领域的深度知识发现与预测、特定领域特征普适机理凝练的知识融合技术。  相似文献   

17.
随着卫生系统的信息化进程的加快,电子病历及其安全性问题成为制约医院数字化的重要因素之一。基于签密和盲签名技术的安全电子病历方案在医生生成原始病历后由患者验证并签密,并由权威时间戳机构进行盲签名,最终送病历保管员保存。在该方案中,虽然医生、患者、权威时间戳机构和病历保管员都可以接触到电子病历,但只有医生和患者才可以查阅到原始电子病历,并且只有医生在得到患者同意后才可以更新电子病历;权威时间戳机构和病历保管员只能接触到签密后的电子病历并不能得知原始的电子病历。这种电子病历方案所具有的高安全性可以更好地保护患者的隐私,并在一定程度上缓解医患纠纷。  相似文献   

18.
《莆田学院学报》2017,(5):41-44
分析了电子病历编辑器的功能需求和系统架构,利用和封装Rich View组件,实现电子病历的打开、编辑、保存及个性化打印等功能。该编辑器提供源码二次开发平台,便于系统的扩展,进而提供更好的适应性。根据目前在中小医院的使用情况,该电子病历编辑器运行安全可靠。  相似文献   

19.
目的:比较我院实习医师用Word文档编辑功能的电子病历与手写病历在不同病因发热住院患者临床应用中的规范性差别。方法:选择收住我科的不同病因发热住院患者电子病历112份,手写病历82份,对发热症状的特征如热度、热型、热程及其伴随症状等进行统计,分析两者病案规范性差别。结果在对呼吸道症状描述的全面性,规范性上明显优于手写病历(P<0.05),其他的伴随症状的描述包括发热症状的特征描述两者比较无统计学差异(P>0.05)。结论把电子病历的功能模块和Word文档有机地结合起来,既能加强电子病历书写的全面性和规范性,又不失去其个性化。  相似文献   

20.
针对中小医院实施电子病历系统存在的困难,提出基于Word编辑器的电子病历系统,利用XML技术来描述电子病历的结构模板,并对电子病历系统实现过程的关键问题给出解决方案。经用户使用,该系统避免了专门使用培训,便于实施应用,提高了病历书写的效率和规范。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号