您好、欢迎来到现金彩票网!
当前位置:秒速时时彩计划 > 随机归约 >

矩阵的低秩近似算法及其应用

发布时间:2019-05-31 02:11 来源:未知 编辑:admin

  随着计算机的不断发展和互联网的快速普及,人们收集数据以及存储数据的能力都大大提高。在过去十年里,无论在科学研究还是在社会生活的各个领域都积累了大量的数据。如何对这些数据进行分析以发掘数据蕴含的有用信息以及如何有效管理这些数据已经成为计算机科学和应用数学领域共同关心的中心话题。许多的机器学习(如核学习,度量学习)和数据管理问题(数据差分隐私)都可以以矩阵的形式表达,然而在实际应用中往往涉及到百万甚至千万条记录或样本,基于矩阵的数据分析技术的空间和时间复杂度上会随着问题的规模呈二次方增长,这使得很多大规模的应用马上变得不可行。因此近似一个目标矩阵而令数据分析技术更精确更适合于大规模的实际应用已成为当今机器学习和数据管理领域十分热门的话题。受到支持向量机、压缩感知和非负矩阵分解等稀疏和低秩等技术的启发,人们开发了一系列基于矩阵分析技术的机器学习和数据管理算法。 本论文主要讨论了矩阵的低秩近似算法以及在机器学习和数据管理中的应用。总的来说,本博士论文主要有三点贡献。 1)提出了一个快速的算法来解决低秩二次半正定优化问题。低秩矩阵近似算法在大规模机器学习上是一个非常有效的模型,因为它不但减低内存和运行时间的复杂度,而且在保持着高准确率的同时提供了一种很自然的正则参数的方法。在本论文中,我们讨论了一类特殊的非凸二次矩阵半正定优化问题。虽然问题是非凸的,我们研究了这些问题的一些特殊结构,从而设计了一个快速收敛的局部最优的算法。而且,我们提出的算法运行效率高,在一系列机器学习中重要的具体问题上都表现了很好的可拓展性,这些问题包括稀疏特征值,距离度量学习以及核学习问题。大量在UCI数据集上的实验结果表明我们提出的算法有着运算速度快和测试精度高的优点。 2)提出了一个双边贪心策略的低秩半正定优化算法。很多的机器学习任务(如度量学习和流型学习)都可以归约为凸半正定规划问题。为了满足很多大规模的机器学习任务需求,如何设计一个鲁棒的、可扩展的、适合大规模的半正定规划问题是很多学者一直在探讨的问题。在本文中,我们提出了一种新颖的双边贪心优化(BILateral Greedy Optimization, BILGO)算法求解一个大规模数据集上通用的半正定规划问题。和以往的方法不同,BILGO在每一步优化迭代中采用了一种双边的搜索策略,它通过使用上一步的解和一个秩1矩阵的线性组合来决定当前的半正定的解,而这个秩为1的矩阵可以通过计算当前迭代的下降方向的主特征值向量来快速获得。通过优化双边组合的系数,BILGO总是能降低评价函数,一直到KKT最优条件满足为止,因此算法能保证收敛到全局最优解。事实上,对于一个-精度近似的解,BILGO收敛的所需迭代次数为O(∈~(-1))。我们提出的算法因此可以成功地结合当前传统的秩1更新的算法和梯度下降的算法的效率。最后一点,也是本论文的主线,就是BILGO通过简单的修改就可以处理低秩约束的半正定优化问题,低秩算法因此可以改进我们原来的贪心算法,因而使得我们的优化更加鲁棒和快速。我们的在大规模的实验分析表明BILGO在一系列问题上都取得了较好的效果。 3)提出了一个在差分隐私框架约束下的快速准确的批线性查询处理优化算法。差分隐私是一种很有前景的用于对敏感数据统计查询的隐私保护处理模型。该模型通过在每个查询的结果上注入随机噪声而使得攻击者根据加噪音后的结果从理论上难以推断任何个人记录是否存在在统计查询中。差分隐私化的查询处理的主要目标是最大化的查询结果的准确性,同时满足所承诺的差分隐私度。以往的研究,特别是李等人建议用适当的策略矩阵,作为一个整体处理一批相关查询的方案比单独地处理这些查询精度高得多。然而,就我们所知,对于任意的查询集,目前还没有有效的可以找到一个很好的策略矩阵的优化算法。现有的方法要么所产生的策略矩阵质量差(往往比最直接的方法差),要么就是即使对于中等大小的维度数据都需要非常昂贵的计算开销。基于这样一个出发点,我们提出了矩阵的低秩机制来解决差分隐私下的线性查询批处理优化问题。该模型是差分隐私下第一个实用的基于低秩近似算法的线性查询优化模型。再者,我们证明了低秩机制所取得的精度是差分隐私下的任何机制的理论下界相近。大量真实数据下的实验表明,我们提出的低秩机制性能的效果都大大优于现存最具代表性的方法。本学位论文采用排版系统LATEX编写。

  宋海洲;TSP问题的一种快速近似算法及应用[J];华侨大学学报(自然科学版);2005年03期

  杨宪泽,雷开彬,吴守宪,张上游,宁爱华;一种句型转换和近似机器翻译方法及算法[J];计算机工程与科学;2005年11期

  陈刚;徐青川;;机械手抓取排序问题(MSP)的最小权匹配算法[J];西安科技大学学报;2005年04期

  樊广佺;王小牛;杨炳儒;;平面点集凸壳的一种近似算法[J];计算机工程与应用;2007年12期

  王继强;李国君;;基于设施选址的Steiner问题的算法[J];计算机科学;2007年09期

  郭文兰;张彤;;矩形件排样优化的双向双原算法[J];哈尔滨理工大学学报;2008年02期

  许金星;吴素萍;;旅行售货员问题的图论近似算法[J];计算机工程与应用;2009年32期

  何晓琼;陈冲;李荣珩;;工厂地址集中的k-种产品选址问题的近似算法[J];计算机工程与应用;2010年08期

  王晨;杨曙;;A型变尺寸装箱问题之模型及算法研究[J];计算技术与自动化;2010年03期

  何勇;互联网通信中的信息选取与分布问题的建模与求解[J];计算机学报;2001年06期

  徐大川;韩继业;;关于图划分问题的改进的近似算法[A];第六届中国青年运筹与管理学者大会论文集[C];2004年

  周露;吴瑶华;黄文虎;闻新;;一种推广卡尔曼滤波的近似算法[A];1995中国控制与决策学术年会论文集[C];1995年

  张雷;;关于多人旅行商与调度问题[A];1995年中国控制会议论文集(下)[C];1995年

  杨盛;吴澄;崔亚军;金尊和;王然;;用变邻域搜索法求解生产制造系统中的整数规划[A];1995年中国控制会议论文集(下)[C];1995年

  张雷;郑维敏;;广义旅行商问题、放映员问题和一类调度模型[A];1996年中国控制会议论文集[C];1996年

  谭思彤;吴凯峰;涂奉生;;2-机flowshop批调度问题及其遗传算法[A];1998年中国控制会议论文集[C];1998年

  姚俊;黄道;;现代优化算法在换热网络合成中的应用[A];2005中国控制与决策学术年会论文集(上)[C];2005年

  田世俊;李建;朱洪;;多需求目标的UFL问题及其近似算法[A];2005年全国理论计算机科学学术年会论文集[C];2005年

  任建峰;张玉忠;孙国;;一种新的柔性车间排序问题[A];中国企业运筹学学术交流大会论文集[C];2005年

  陈荣军;;一类自由作业的供应链排序研究[A];第九届中国青年信息与管理学者大会论文集[C];2007年

  丛伟杰;几类几何最优化问题的近似算法研究[D];西安电子科技大学;2011年

  沈灏;与Due Date相关的排序问题研究[D];浙江大学;2002年

  文园;天线三维辐射方向图的近似计算方法[D];西安电子科技大学;2007年

  张群发;具有相容约束条件的单机平行分批排序问题[D];郑州大学;2005年

  张永生;移动通信系统中的信道分配算法研究[D];兰州理工大学;2007年

  赵卫中;欧氏平面上货郎问题的一个多项式时间近似方案的改进与实现[D];山东大学;2007年

http://parroche-dorioz.com/suijiguiyue/103.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有