首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
时间序列的相似性度量是时间序列数据挖掘研究中的一个重要问题,是进行序列查询、分类、预测的一项基础工作。寻求一种好的度量对提高挖掘任务的效率和准确性有着至关重要的意义。目前从事这方面的研究除了少许理论论述外,几乎都采用一种固定的方法,即提出具体要求并提供实验数据。然而,大多数实验方法不是使用范围有限就是侧重点不同。为了提供一个比较全面的实验验证,用1NN分类算法进行了大量的时间序列交叉验证实验,重新评估了其中的弹性度量,并使用不同应用领域的28个时间序列数据集进行比较,结果表明,该方法具有更高的准确性。  相似文献   

2.
介绍了时间序列相似性搜索研究的现状,以指定查询序列搜索为算法基础,将其应用于具体的数据统计实践中去.时向序列相似性搜索研究具有挑战性及局限性.  相似文献   

3.
张光鉴开创的思维科学理论———相似论与戴维·玻姆贯穿于其创造力理论的"相似观"之共同见解在于:人类的创造过程与自然界的创造过程是相似的,具有基于相似性的统一原理;基于相似性的形象类比乃是创造力的真正源泉;科学、艺术、哲学等不同领域的创造性思维具有共同的本质。  相似文献   

4.
数据稀疏是协同过滤预测精度的一个重要影响因素。Slope One算法使用简单的线性回归模型解决该问题,但它只使用评分数据做计算,未考虑相似性。提出一种基于用户习惯偏好相似度的Slope One算法(UPS Slope One)。UPS Slope One首先基于用户习惯偏好聚类,得到三组不同偏好的用户,然后分别计算各组评分偏差,计算时将用户习惯偏好相似度融入其中,最后使用线性回归模型预测评分。在MovieLens数据集上的实验表明,该算法可得到更高的推荐质量、预测准确性和稳定性。  相似文献   

5.
一种文本相似性的度量方法和计算方法   总被引:2,自引:0,他引:2  
本文提出了一种判定两个文本相似性的度量方法,定义了相似度和摘录度,对其意义做了简单的分析;并用动态规划的思想给出了时间复杂度为O(mn)的计算方法。  相似文献   

6.
针对时间序列相似性研究中存在动态时间弯曲DTW复杂度过高与分段思想易造成特征丢失的问题,提出了一种基于形状和升降性提取序列数据重要特征点的DTW相似性搜索算法,利用关键特征点快速筛选相似候选子序列集合,计算各个原始子序列的DTW距离,与改进的分段DTW距离度量方法进行实验比较。结果表明,该方法提高了相似性搜索效率,并具备更高的相似度。  相似文献   

7.
为了实现对未知物体的分类,提出了一种基于改进解释树的部件级三维物体分类方法.采用部件级描述形式,使得对物体类的描述更加简洁.所提的物体分类方法主要包括2个核心处理模块,即改进的约束解释树搜索和形状相似性度量计算.利用该方法,不但能够进行未知物体与三维模型之间的全局匹配和部分匹配,得到具有形状相似度排序的分类结果;而且能够实现焦点匹配,即对同一个未知物体,为其标注不同的关键部件,通过焦点匹配便可以获得所有包含对应关键部件的三维模型.大量的实验结果证明了所提出的部件级三维物体分类方法的有效性.  相似文献   

8.
图像的相似性度量是基于内容的图像检索技术中的一个非常关键的问题。理想的图像相似性度量方法应该能满足人的视觉特性,能够使得视觉上相似的图像间具有较小的距离,也就是说二者的相似度越大,其距离就越小。很显然,选择的相似性度量方法对图像检索结果的影响很大,相似性度量方法的好坏会直接影响到图像检索的性能。所以对常用的相似性度量的方法进行分析,并提出将来相似性度量的研究方向很有必要。  相似文献   

9.
运用时问序列分析法对四川省出生人口建立非平稳时间序列模型和回归模型的组合模型,对高中毛入学率建立Logistic生长曲线复合模型,进而对2010—2020年的中小学在校学生人数及教师需求量进行预测。结果显示四川省未来10年中小学在校生数将会减少542万余人,小学教师逐渐超标,高中教师严重不足。高等师范院校近两年可以按5%左右的比例扩大招生,重点培养高中教师。  相似文献   

10.
秦可卿人生的最后历程是《红楼梦》研究的一个热络而有趣的问题。其实《红楼梦》文本中已经包含了答案,只要充分关注第10回到第14回的时间序列,就不难得出作者的结论:秦可卿并非病故,而是自杀身亡。  相似文献   

11.
介绍了时序分析法的基本原理及注意事项,编程步骤为前期处理、分析问题、绘制时序图、资源分配、程序编制和调试优化.举例说明了此方法的具体应用过程.  相似文献   

12.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

13.
利用时间序列模型对全国2000年5月到2012年4月的月度居民消费价格指数(consumption priceindex,CPI)建立了自回归移动平均模型(ARMA)。并对2012年4月的CPI进行了预测,结果表明,ARMA(1,1)是描述我国CPI变化趋势相对较优的时间序列模型。  相似文献   

14.
Statistical properties of stock market time series and the implication of their Hurst exponents are discussed.Hurst exponets of HJIA (Dow Jones Industrial Average)components are tested using re-scaled range analysis.In addition to the original stock return series,the linear prediction errors of the daily returns are also tested.Numerical results show that the Hurst exponent analysis can provide some information about the statistical properties of the financial time series.  相似文献   

15.
高中毕业生数和普通高等教育招生数是影响高考录取率的2个重要因素。分析福建省小学、初中、高中各阶段的毕业率和升学率以及普通高等教育招生数,用时间序列方法分别建立合适的数学模型,进而预测高中毕业生人数和普通高等教育招生人数,推测出高考录取率的短期发展趋势。预测结果表明,2014—2015年福建省高考录取率可能逼近100%。  相似文献   

16.
Seismic data show some important characteristics, such as big volume and strong timeliness. Specific to the time series data of earthquake precursory observations, a piecewise linear representation based on the sliding window mean value (PLR_MTSW) algorithm is proposed. With this algorithm, the mutation points can be identified accurately according to the rate of mean value change, while the main features of time series are maintained well. This algorithm can also smooth the noise and improve the compression accuracy with sliding window. Meanwhile the local extreme points can be identified effectively according to the change of mean value trend within window.  相似文献   

17.
人类对于语言的认知存在着一定的相似性和差异性,在时间隐喻这个方面也有所表现,本文通过若干语言实例进行对比,对英汉时间隐喻同异进行了初浅的分析,从认知学角度探讨语言发展规律性。  相似文献   

18.
一种利用时间序列分析的特征提取与损伤预警方法   总被引:1,自引:0,他引:1  
针对结构健康监测中如何基于在线监测数据实现损伤诊断的问题,提出了一种利用时间序列分析ARMA模型的特征提取和损伤预警方法.首先对所有监测数据样本建立ARMA模型,以模型中AR部分参数的主成分矩阵构建Mahalanobis距离判别函数,提出了一种新的结构损伤敏感指标DDSF.然后,采用t-检验考察该指标在损伤前后是否存在显著性变化,从而可以有效地实现结构损伤预警.三跨连续梁数值算例表明,提出的结构损伤特征指标对结构的微小损伤具有敏感性,具备结构在线实时损伤预警的应用价值.  相似文献   

19.
混沌时间序列单变量和多变量重构的预测比较   总被引:2,自引:0,他引:2  
提出了多变量混沌时间序列相空间延迟重构中延迟时间间隔和嵌入维数的选取方法,给出了多变量混沌时间序列的局部平均预测法,局部线性预测法和BP神经网络预测法等3种非线性预测方法.通过Lorenz系统的仿真计算表明,无论用3种非线性预测方法中的哪一种,多变量混沌时间序列要比单变量混沌时间序列的预测误差小得多,即使前的数据长度只有后的一半,前的预测误差也要小很多.另外从预测误差最小的角度验证了多变量混沌时间序列相空间延迟重构中延迟时间间隔和嵌入维数选取方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号