首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
本文主要采用主分量分析方法和二次判别分析(QDA)有监督分类的方法来对基因芯片(微阵列)数据进行分析.PCA是一种提取海量的数据有效特征的有效方法.可以获得与原来基因芯片数据更为接近的成分的提取特征的效果.实验表明采用PCA方法事先对数据处理不可以提高基因芯片数据分析的准确性.得出结论可为工业应用提供科学依据.  相似文献   

2.
线性判别分析(Linear Discriminant Analysis,LDA)是用于降维和分类的方法,然而在遇到小样本问题时,由于全局散布矩阵是奇异的,所以传统的LDA方法是不适用的。为了解决LDA的这种缺点,提出了基于最小二乘线性判别分析(Least Squares Linear Discriminant Analysis,LS-LDA)的正则化算法,在LS-LDA中分别加入关于加权矩阵的L1范数、L2范数和弹性网络的惩罚项、来解决小样本问题,使模型具有鲁棒性和稀疏性。在对回归分析、正则化方法和LS-LDA相关技术进行深入分析的基础上,构建正则化最小二乘线性判别分析框架算法,实现数据降维。结合标准文本数据集进行实验,采用KNN(K-Nearest-Neighbor)分类器进行文本分类。实验结果表明,正则化的LS-LDA具有很好的分类性能,其中以加入了弹性网络惩罚项的LS-LDA最优。  相似文献   

3.
文章主要采用主分量分析法和线性判别分析(LDA)有监督分类的方法来对基因芯片(微阵列)数据进行分析。PCA是一种提取海量的数据有效特征的有效方法。仅可以获得与原来基因芯片数据更为接近的成分的提取特征的效果。结果表明采用PCA方法事先对数据处理不可以提高基因芯片数据分析的准确性。  相似文献   

4.
生物量是森林生态系统生产力的最好的指针,是森林生态系统结构优劣和功能高低的最直接的表现,是森林生态系统环境质量的综合体现.基于森林经理调查和偏最小二乘理论,联系计算生物量的模型现状,尝试了在切比雪夫(chebyshev)多项式的基础上基于MATLAB7.1平台建立偏最小二乘生物量模型,并通过其与传统生物量模型按照东北地区常见树种进行比较,得出偏最小二乘方法生物量模型计算生物量的精度更高.  相似文献   

5.
我国民间投资的偏最小二乘回归研究   总被引:1,自引:0,他引:1  
近年来,民间投资在我国经济增长中所起的作用越来越重要,其增长率几乎已经成为经济增长的“睛雨表”。针对影响民间投资的众多因素,我们用偏最小二乘法进行了回归分析,结果显示,提高最终消费率、降低银行贷款利率等措施将对提高民间投资总额起到积极作用。  相似文献   

6.
酒精度是白酒的主要理化指标.传统的酒精度检测方法繁琐、费时.采取近红外光谱技术结合偏最小二乘回归法建模,通过相关光谱的方法选择最佳建模光谱区域(955 nm-1 047 nm和1 108 nm-1 347 nm),得出线性回归方程.结果显示,主成分个数为3时,模拟训练集的线性相关系数达0.980 2,白酒校验集的相关系数为0.957 4,总体方均根误差为1.800.该方法方便快捷、高效准确、廉价无损,有望成为检测白酒酒精度的新方法.  相似文献   

7.
在波长范围220-370nm,间隔0.2nm,测定了三种硝基甲苯异构体混合物乙醇溶液的吸光度数据,并用偏最小二乘法进行回归分析,结果显示邻硝基甲苯、间硝基甲苯和对硝基甲苯的回收率分别在98.225%-101.19%、100.25%-103.09%和99.547-100.94%之间.从计算结果可以看出,偏最小二乘法具有良好的预测效果,可用于多组分混合物的同时测定.  相似文献   

8.
基于辞典的模式和机器系统翻译的技术一度成为人们进行跨语言信息检索的热点研究技术.基于辞典的模式就是采用机读辞典来做翻译,这里主要的问题是词汇的歧义性,另一个问题是辞典本身的覆盖度不够,翻译往往不够确切.为解决上述问题,本文提出了一种基于偏最小二乘理论的中间语义的跨语言信息检索方法.  相似文献   

9.
给出了加权几何平均偏最小二乘回归分析预测模型,解决了对数预测误差极小化意义下的预测精度问题,为偏最小二乘回归分析的改进提供了新途径.  相似文献   

10.
文章介绍了处理多元线性回归模型中多重共线性问题的有偏回归方法——岭回归和偏最小二乘回归,并通过实例比较了两种方法建立的回归方程的拟合效果,而偏最小二乘回归方法相对岭回归方法要更优.  相似文献   

11.
所统计分析的数据集是前列腺癌基因数据集.采用分片逆回归方法和线性判别分析(LDA),二次判别分析(QDA).对基因芯片(微阵列)数据进行分析.用SIR降维,用LDA和QDA分类.讨论分片逆回归方法和二种方法对基因样本进行分类的效果.  相似文献   

12.
本文主要采用两种降维的方法和k-近邻法(KNN)有监督分类的方法来对基因芯片(微阵列)数据进行分析。PCA,PLS是一种提取海量的数据有效特征的有效方法,可以获得与原来基因芯片数据更为接近的成分的提取特征的效果。比较PCA降维方法和PLS降维方法对KNN统计判别分类的效果。  相似文献   

13.
基于模糊线性判别分析的控制规则约简   总被引:1,自引:0,他引:1  
在线性判别分析的基础上提出了一种模糊线性判别分析方法,对模糊数据进行判别分析,并将这种方法应用于模糊化控制器的规则约简,从而在不影响控制品质的基础上,减少控制器运算量.实验表明,经过规则约简之后的模糊控制器能够顺利完成倒车控制,具有较高的普适性.  相似文献   

14.
为了对高维的基因表达数据进行有效的降维,本研究采用基于Fisher准则的思想对特征空间进行特征组合,从而得到新的特征空间。实验结果表明,在无法对数据再进行降维的原特征空间中,经过线性变换的方法得到的新特征空间可继续对其数据进行降维。通过这种方法,能将四川省医学科学院动物研究所所提供的抑郁症大鼠DNA的基因表达数据有效地从4353维降到1393维。  相似文献   

15.
广东省马尾松毛虫数据管理及测报系统(SMC)由数据管理、建模分析、咨询服务、系统维护4个系统构成。数据管理子系统能对森林虫害数据及气象数据进行输入、修改、查询、统计、数据编辑、提取、浏览,报表输出、数据传输、预测等方面的管理。建模分析子系统可直接从数据库中取数据进行多种方法建模和绘图。该系统已被26个县(市)应用,取得较好的经济效益和生态效益。  相似文献   

16.
This study aimed to analyze the volatile chemical profile of Longjing tea, and further develop a prediction model for aroma quality of Longjing tea based on potent odorants. A total of 21 Longjing samples were analyzed by headspace solid phase microextraction (HS-SPME) coupled with gas chromatography-mass spectrometry (GC-MS). Pearson’s linear correlation analysis and partial least square (PLS) regression were applied to investigate the relationship between sensory aroma scores and the volatile compounds. Results showed that 60 volatile compounds could be commonly detected in this famous green tea. Terpenes and esters were two major groups characterized, representing 33.89% and 15.53% of the total peak area respectively. Ten compounds were determined to contribute significantly to the perceived aroma quality of Longjing tea, especially linalool (0.701), nonanal (0.738), (Z)-3-hexenyl hexanoate (−0.785), and β-ionone (−0.763). On the basis of these 10 compounds, a model (correlation coefficient of 89.4% and cross-validated correlation coefficient of 80.4%) was constructed to predict the aroma quality of Longjing tea. Summarily, this study has provided a novel option for quality prediction of green tea based on HS-SPME/GC-MS technique.  相似文献   

17.
在讨论目前高校教学中存在问题的基础上,简单介绍粗糙集理论及数据挖掘技术。以高校学生成绩为例,提出基于粗糙集理论的数据挖掘技术在高校学生成绩分析中应用的解决方案。  相似文献   

18.
《社会科学引文索引》(Social Science Citation Index,简称SSCI)作为国际性的社会科学文献数据库,是衡量国际学术影响力的重要依据之一。笔者通过对2001~2008年的SSCI部分教育学文献统计数据的分析对比,对中国教育学的国际地位与研究现状进行评述。  相似文献   

19.
随着各类医疗健康信息数量的增长,如何利用医疗健康大数据辅助临床诊疗和科研,已经成为各医疗科研机构普遍关注的问题。针对该问题,设计并实现了一种基于 Spark 的分布式健康大数据分析系统。系统采用大数据分析技术并基于随机森林模型,应用多个弱分类器将多个决策树获得的结果进行集成,基于该模型实现了睡眠质量预测,同时还研究了权重较高的影响因子。最终实验预测准确率达 96.84%。实验结果对于睡眠质量分析具有一定参考意义,且系统能够较好地满足健康大数据的分析处理需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号