首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
印章识别因采集标注困难和印章图像退化等导致识别难度较大。数据增强可以缓解数据缺乏的困境,结合ViT (vision transformer)模型提取印章的全局特征,可以提高复杂情境下的印章识别能力。首先根据印章所处的情境特点进行分析,针对分析结果制定数据增强策略,进而扩充训练集;然后将印章图像输入ViT模型中,进行特征提取和印章识别。本文采集并标注《兰亭序》等16幅书法字画上包含的1259枚印章,经过11个数据增强模块处理后,训练集包含127159枚印章图像。与基线模型ResNet50相比,ViT模型的F1值提高了12.17个百分点,去除数据增强所得扩展数据后,所有模型均无法收敛。在标注数据较少的情况下,通过数据增强和ViT模型可以对印章图像进行准确识别。本文方法尚缺少语义推理能力,无法识别训练集中未出现的印章。  相似文献   

2.
针对图书馆开放流通带来的错架乱架问题,论文提出基于图书索书号识别的智能化图书错序检测方法。该方法通过图像采集设备获取在架图书图像,首先利用边缘提取和霍夫变换算法检测书脊边缘实现图书图像分割,然后利用颜色直方图分割索书号区域,并采用光学字符识别技术识别出图书索书号进行错序分析,以实现错序图书的快速定位。论文方法对构建移动机器人的图书自动巡架系统具有重要意义。  相似文献   

3.
针对电力机车走行部螺杆数量众多导致巡检费时费力等问题,提出了一种基于深度学习的螺杆松动故障智能检测方法。通过将采集到的螺杆图像建成标签数据集,并用于Pytorch框架下的YOLOv3网络模型训练,可以实现螺杆快速识别和裁剪。利用Open CV计算机视觉库对裁剪得到的螺杆图像进行图像增强、Canny边缘检测、最小外接矩形算法等传统图像处理手段,提取目标轮廓并计算其偏转角度与阈值的差值,实现螺杆松动的定量检测。结果表明,所提方法对螺杆松动故障具有较好的识别效果,同时能够实现自动化、智能化,避免人为主观判断带来的影响。  相似文献   

4.
针对现代图书馆对图书自动盘点的需求,基于计算机视觉和人工智能技术设计了图书馆图书盘点系统。使用Mask R-CNN深度学习网络对书脊图像进行实例分割,再对分割后的书脊图像提取书架号和书名位置并进行文字识别,最终对书架号和书名两步验证确认书籍是否乱架。通过实地采集图像并测试表明,本文方法对于不同类型的书脊图像能够实现较好的分割和识别效果,能够准确地检测出乱架书籍,适合搭载在图书馆自动盘点机器人上,可以有效提高图书盘点的工作效率。  相似文献   

5.
古籍善本数字化的尝试——中国古籍善本查阅系统述略   总被引:14,自引:0,他引:14  
古籍善本是图书馆中使用与保管矛盾最为突出的文献 ,而解决矛盾的最佳途径是实现数字化。它的全文数据录入应以保持原貌为根本。上海图书馆研制的中国古籍善本查阅系统 ,将馆藏善本古籍的全文数据以图像形式录入光盘 ,并对标引、检索、查阅等功能进行了开发 ,为古籍善本的数字化作了尝试。  相似文献   

6.
本文介绍了一种自行设计的基于CIS的纸币号码图像识别技术。利用接触式图像传感器(CIS)采集纸币号码的图像采集系统,采用FPGA与ARM作为核心模块,利用基于号码笔画结构的判定树识别算法,识别出人民币号码。  相似文献   

7.
提出了一种利用深度学习算法结合工业相机的烟支激光打孔异常检测方法。针对该检测过程中的难点,包括图像采集困难、检测响应时间要求和抗干扰性等问题,作者选择了彩色工业相机进行图像采集,并采用YOLOv3目标检测算法进行烟支打孔点位的定位和分类。详细介绍了YOLOv3检测算法的实现流程,包括数据标记、模型训练、调整置信度和非极大抑制等步骤。此外,为了提高图像清晰度和检测速度,提出了图像增强和使用图像金字塔变换的方法。经过实际测试,该方法在烟支激光打孔异常检测中取得了很好的效果,具有高准确率、强抗干扰性和实时性等优点。  相似文献   

8.
设计一个可以自动识别古代汉语文献中姓名的模型系统,对纪传体古代汉语文献中的姓名识别作了实验和探索。以晋陈寿的《三国志·蜀书》十五卷为实验文本,对系统的识别效果进行测试,识别结果为召回率75.4%,准确率91.9%。实验证明,基于规则的方法对于识别纪传体古代汉语文献中的姓名是可行的。  相似文献   

9.
倪广富 《大观周刊》2012,(5):120-120
本文是对基于无线传感器网络和模l糊神经网络(FNN)的智能社区入侵检测系统的详细研究誊该系统由基于园正tM(高级重usc计算机)数据采集节点,无线网络和中央控制器组成。数据采集强节点利用传感器来采集信息,通过图像检测算法来处理所采集的数据信,钆然后利用无线网络将处理后的数据传送至中央控糊器的。当有入侵时,系统启动相机和模糊神经网络.用来拍摄并传输人脸图像。我们构建了模糊神经网络,并用Lenbe略一马奁特优化算法训练模糊神经网络,从而提高系统的收敛速度和识别的准确性。随着自我学习能力的加强和非线性函数在模糊神经网络的应用,这种识别方法可以来精确识别人脸。该系统解决了传统系统缺陷,提高了系统的智能性,减轻工人的工作压力。  相似文献   

10.
[目的 /意义]针对历史古籍事件识别问题,对比序列标注方法和文本生成方法,探究两种方法在古汉语上的表现,构建模型实现历史古籍事件识别自动化,以提高面向历史古籍构建知识图谱的效率。[方法 /过程]选取《三国志》为原始语料,序列标注实验对《三国志》事件数据集进行BMES标注,构建BBCN-SG模型,文本生成实验构建T5-SG模型,对比两种方法的表现。接下来,构建RoBERTa-SG、NEZHA-SG模型展开生成模型的对比实验。最后,结合三个文本生成模型,融入Stacking集成学习的思想,构建Stacking-TRN-SG模型。[结果 /结论 ]在历史古籍事件识别建模问题上,文本生成方法的表现明显优于序列标注方法。而在文本生成方法中,RoBERTaSG模型的识别效果综合最好。Stacking集成学习能够大大提高生成模型的识别效果,构建的Stacking-TRN-SG模型达到70.35%的召回率,初步实现历史古籍的自动事件识别。  相似文献   

11.
文献的酸度对文献的保存寿命具有重要影响,为了掌握善本古籍特藏文献的酸化状况,笔者于2001年对国家图书馆善本古籍特藏文献纸张的酸度进行了全面检测,取得了大量而又十分珍贵的数据。本文介绍了国家图书馆善本古籍特藏文献酸度检测结果,并对检测结果进行了多方面、多角度分析,还提出了对善本古籍特藏文献防酸去酸建议。对于掌握善本古籍特藏文献的酸度现状,以及制定防酸、去酸计划和规划具有重要的参考价值。  相似文献   

12.
[目的/意义] 通过对国内中医古籍数字化领域生命周期进行划分,系统性述评该领域的发展阶段及其特征,为面向数字人文的中医古籍数字化研究提供决策参考。[方法/过程] 从4个期刊数据库采集该领域期刊文献题录,通过最小二乘法和年度文献增长量确定中医古籍数字化研究的生命周期,对各阶段的相关文献进行主题聚类分析和主题演化分析以识别出各领域的研究热点和演化趋势。[结果/结论] 将国内中医古籍数字化研究划分为3个阶段,识别出各阶段的研究主题及主题在不同阶段中的演化路径,在总结前人研究基础上,从数字化资源、技术体系构建和应用服务方向3方面提出未来中医古籍数字化的发展趋势。  相似文献   

13.
当前,一些学术期刊在利益的驱使下,通过大量自引和结成"互引同盟"的方式快速提高被引频次和影响因子等指标,影响了引文分析的公平性.基于此,本文首先利用数据挖掘中的CART分类算法构建期刊操纵引用行为的识别模型,设计了识别操纵引用行为的4个评价指标:自引率、被引年代分布、被引密度比和引用密度比.并采用国内某引文数据库中的50本综合性社会科学期刊作为实验样本,采集该期刊群2009年的引文数据作为训练数据集,2008年的引文数据作为验证数据集.最后,运用2010年的引文数据对期刊操控行为识别模型的有效性进行验证,实验结果证明,本文构建的分类模型可以有效地对期刊引用操纵行为进行识别.  相似文献   

14.
图文扫描仪是一种快捷高效的录入设备,能够处理各种文字、图像,还能进行光学OCR识别.在图书馆图文扫描仪也大有用武之地,可以广泛运用于文字识别、文献加工、图像保存、网站建设等方面.……  相似文献   

15.
基于关键词的科技文献聚类研究   总被引:1,自引:0,他引:1  
描述一种基于改进TF IDF特征词加权算法的科技文献聚类方法:首先提取科技文献的特征词;然后根据特征词的词频、所在位置和词性为特征词加权,建立科技文献的向量空间模型;接着使用基于密度的聚类算法对科技文献向量空间模型数据进行聚类分析;最后使用主成分分析法对科技文献聚类的结果进行标识,利用F measure方法对聚类结果进行评价。实验表明,用提出的科技文献聚类方法能够从所检索的科技文献中发现热点研究领域,并能识别具有学科融合性质的研究方向。  相似文献   

16.
古代科技文献具有丰富且高度关联的语义,然而不同收藏机构整理和发布的数字古籍资源却是异构的,而运用语义网的原理和技术能够解决古代科技文献数字资源分布异构、互操作、跨语言等问题。以农学古籍为例,提出基于自编《中国古代科技文献总目(农学卷)》的书目本体关联数据的语义出版解决方案:在该书目基础上,半自动抽取出1285种农学古籍的元数据,识别出粗、中、细3种粒度的知识单元;再通过逻辑推理、模式匹配等方式建立实体关系和属性关系两种内部关联,调用开放关联数据的API建立与网络本体和知识组织系统的外部关联;经由上述步骤开发农学古籍知识库,通过3种模式服务用户。农学古籍的语义出版虽然具有广阔的应用前景,但也不可忽视其在基础层、资源层所面临的巨大挑战。  相似文献   

17.
国际图像互操作框架(International Image Interoperability Framework,IIIF)通过定义一组通用的应用程序编程接口规范来确保全球图像存储的互操作性和可获取性,为古籍资源的统一发布提供了解决方案。本文通过网络调查和案例分析,揭示了基于国际图像互操作框架的古籍图像数字资源库的资源主题、出版形式以及实现功能,并在此基础上总结了国际图像互操作框架在古籍资源整合与重用、智慧应用以及古籍出版转型中的价值与挑战。同时,本文从古籍资源库的内容建设、国际图像互操作框架的应用和深化研究以及出版行业规范与服务水平三个方面进行了深入探讨,助推基于国际图像互操作框架的古籍数字出版与古籍研究的转型与发展。  相似文献   

18.
[目的/意义]从科技论文中自动识别与抽取研究设计指纹,能够为科研人员项目设计、研究方法的有效性评估、研究过程问题诊断、研究结果鉴别与评价提供重要的方法论和研究操作支撑。[方法/过程]基于科技论文研究设计指纹的概念模型,提出基于多规则模式混合机器学习方法,设计并实现指纹识别算法,并以数据挖掘领域的期刊文献数据为例,对识别算法的可行性与有效性进行分析验证。[结果/结论]除研究数据与研究趋势外,其他研究设计指纹识别准确率的认可度都基本达到80%以上,覆盖率的认可度,除研究工具与研究数据外,基本达到80%以上。  相似文献   

19.
面向数字人文研究的大规模古籍文本可视化分析与挖掘   总被引:2,自引:1,他引:1  
传统的古籍开发与应用模式已难以适应人文学科研究的需要,人文学科研究者期待一个技术逻辑和人文逻辑相耦合的数字人文研究范式的出现。本文从古籍文献深层次开发与利用出发,利用新的信息技术与面向数字人文研究跨学科方法,以大规模中国古籍文本为研究对象,采用大数据研究理念,对古籍进行整理、标注、自动分词等处理,以词频分析统计为研究核心,采用数据降噪、基于窗口时间单位的统计分析计算、滑动窗口预测等分析与挖掘方法,采用大数据实时分析技术,实现了实时、在线、立体、可视化、定量分析字词的历史词频分布规律,创建了一个以语言学、历史文献学、历史地理学等人文学科研究为主的古籍实时统计分析平台,可辅助研究者在大量的古籍文献中发现新的模式、现象、趋势等,实现古籍开发与应用模式创新的初步尝试。图11。参考文献36。  相似文献   

20.
为了有效提高数字图像文字提取技术的识别率,文章在数字图像处理技术研究的基础上,对图像文本区域定位技术进行研究,并重点介绍了本文提出的文本区域定位算法.算法的详细流程主要包括边缘检测、二值化处理、文本形态处理以及背景噪声去除等,通过在Matlab5.0环境下进行仿真分析,可以看到本文提出的文本区域定位算法能够较好的实现对图像中的文字区域进行定位。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号