导航:首页 > 去中心化 > pca+去中心化

pca+去中心化

发布时间:2023-08-20 11:34:04

㈠ 主成分分析(PCA)

    本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。

    主成分分析(Principal Component Analysis,PCA)是中最常用的降维算法之一,也可以用于数据压缩、去除冗余信息、消除噪声等方面。PCA的目的是找出一组低维数据来代表原高维数据,且保留原始数据中的主要信息。例如有m个数据集,n维特征,我们希望将n维特征降低到d维,而且让损失的信息尽可能小,具体怎么做呢?

    首先通过PCA找出第1个新坐标使得原始数据中方差最大;然后找出第2个新坐标与第1个坐标正交平面使得方差最大;再找出第3个坐标与1,2坐标正交平面使得方差最大...,以此类推,得到d个新维度特征。

    直接一点:就是求出样本集的协方差矩阵 的前d个特征值对应的特征向量,组成矩阵 ,然后对每个样本 进行变换 。

    1)特征去中心化,即每个维度特征减去其均值:

    2)计算协方差矩阵

    3) 对协方差矩阵进行特征值分解

    4)取前d个最大的特征值对应的特征向量组成矩阵 。

    5)对每个样本数据进行变换,

    6)得到降维后的数据

    假定现有10个二维数据集 (2.5,2.4), (0.5,0.7), (2.2,2.9), (1.9,2.2), (3.1,3.0), (2.3, 2.7), (2, 1.6), (1, 1.1), (1.5, 1.6), (1.1, 0.9) ,需要用PCA降到1维。

    首先样本去中心化,这里样本的均值为 (1.81, 1.91) ,所有的样本减去这个 均值 向量后,即中心化后的数据集为 (0.69, 0.49), (-1.31, -1.21), (0.39, 0.99), (0.09, 0.29), (1.29, 1.09), (0.49, 0.79), (0.19, -0.31), (-0.81, -0.81), (-0.31, -0.31), (-0.71, -1.01) 。

    求协方差矩阵:

    求出特征值为 (0.0490833989, 1.28402771) ,对应的特征向量分别为:

由于最大的k=1个特征值为1.28402771,对应的特征向量为 。这也就是特征矩阵 。

    对每个数据样本进转换 得到降维后的数据 (-0.827970186, 1.77758033, -0.992197494, -0.274210416, -1.67580142, -0.912949103, 0.0991094375, 1.14457216, 0.438046137, 1.22382056)

㈡ 去中心化的优缺点是什么

优点:

1、系统安全性高:在去中心化的区块链网络中,无中心节点可攻击。

2、交易安全性高:去中心化的交易方法便捷而简单,无第三方介入,不需要担心信息的泄露。

3、节约性好:由于去中心化处理方式较传统处理方式更为简单与便捷,因此在大数据量交易同时进行时,去中心化的方式会节约资源。

4、自主高效性:去中心化的区块链技术,无需第三方介入,点对点直接交互,使得高效率、无中心化代理、大规模的信息交互方式成为现实。

缺点:

如果“去中心化”广泛使用,权威中心将逐渐被淡化,节点之间传递的信息的可信性与准确性将面临问题。例如,在一个“去中心化”的系统中,有部分节点坏掉,他们可能向外传播错误甚至不传播信息,如此一来无法验证信息传输的准确性。准确性下降,自然无法获得可信性。



去中心化计算

相比之下,集中式计算则是将大部分计算功能从本地或者远程进行集中计算。去中心化计算是一种现代化的计算模式。 与之相反的集中计算,则普遍存在于早期的计算环境当中。 一个去中心化的计算机系与传统的集中式网络相比有很多优点。

台式计算机发展迅猛,潜在的性能远远超过要求的大多数业务应用程序的性能要求。结果,大多数桌面计算机存在着剩余的闲置计算能力. 一个去中心化的计算系统,可以发挥这些潜力,最大限度地提高效率。 然而,它是否增加了整体网络的有效性依然值得商榷。

以上内容参考网络-去中心化

㈢ PCA和LDA

PCA是无监督的降维,降维后方差尽可能的大;
LDA是有监督的降维,希望分类后组内方差小,组间方差大;

聚类,降维;

原有的d维数据转化为k维数据(d>k),新生成的k维数据尽可能多的包含原来d为数据的信息。

让样本的均值为0;
方便后去求取协方差矩阵;
这并不属于数据预处理,因为数据预处理是对每一个特征维度进行处理的,而去中心化是针对每一个样本,这是PCA所必须的过程。
为什么要去中心化

方差:单个随机变量的离散程度;
协方差:两个随机变量的相似程度。
方差和协方差的一些区别

偏差是估计值与真实值之间的差距。
方差是描述预测值的变化范围,离散程度。

计算协方差矩阵

寻找一个线性变换u,使uX,即降维后的新数据方差最大。
这里可以令u的模长为1.
根绝拉格朗日优化后可知,S=λ;
那么最大化投影方差就是最大化原数据的协方差矩阵的特征值。
最佳的投影方向就是最大特征值对应的特征向量。

选取特征值的特征向量组成投影矩阵U=[u1,u2,...,uk]。
UX即为投影后新样本。

由于PCA是基于欧氏距离,因此对于线性不可分数据无能为力。
所以提出kernel PCA 。

分类,降维。
希望降维后类间距离最大,类内距离最小。
引入两个定义,类间散度Sb和类内散度Sw。

在计算类间散度和类内散度的时候用到了类别信息,所以LDA是有监督的降维。

㈣ 区块链的特性

1、去中心化

所谓去中心化,是指由于区块链使用分布式核算和存储,不存在中心化的硬件或管理机构,任意节点的权利和义务都是均等的,系统中的数据块由整个系统中具有维护功能的节点来共同维护。

2、开放性

所谓开放性,是指区块链系统是开放的,除了对交易各方的私有信息进行加密,区块链数据对所有人公开,任何人都能通过公开的接口,对区块链数据进行查询,并能开发相关应用,整个系统的信息高度透明。

3、自治性

区块链的自治性特征建立在规范和协议的基础上。区块链采用基于协商一致的规范和协议(如公开透明的算法),使系统中的所有节点都能在去信任的环境中自由安全地交换数据,让对“人”的信任改成对机器的信任,任何人为的干预都无法发挥作用。



4、信息不可篡改

所谓信息不可篡改,即一旦信息经过验证并添加到区块链,就会被永久地存储起来,除非同时控制系统中超过51%的节点,否则单个节点上对数据库的修改是无效的。

正因为此,区块链数据的稳定性和可靠性都非常高,区块链技术从根本上改变了中心化的信用创建方式,通过数学原理而非中心化信用机构来低成本地建立信用,出生证、房产证、婚姻证等都可以在区块链上进行公证,拥有全球性的中心节点,变成全球都信任的东西。

5、匿名性

所谓匿名性,是指节点之间的交换遵循固定算法,其数据交互是无须信任的,交易对手不用通过公开身份的方式让对方对自己产生信任,有利于信用的累计。

链信是拥有千万级会员用户的区块链落地应用,拥有自己的夸克区块链作为公链,qkibill开源钱包,独立的区块浏览器,是一个完全自主由用户掌握自己数据的区块链平台,夸克链信创新区块链加生活服务平台,致力于打造更好的区块链服务,链信区块链具备以上的几个特点,是真的区块链项目。

㈤ 详解主成分分析PCA

主成分分析( Principal components analysis),简称PCA,是最主要的数据降维方法之一。本文从PCA的思想开始,一步一步推导PCA。

对于 , 。我们希望 从 维降到 维,同时希望信息损失最少。比如,从 维降到 :

我们既可以降维到第一主成分轴,也可以降维到第二主成分轴。那么如何找到这这些主成分轴并且选择最优成分轴呢?

直观上,第一主成分轴 优于 第二主成分轴,即具有最大可分性。
下面解决一些基本概念。

欲获得原始数据新的表示空间,最简单的方法是对原始数据进行线性变换(基变换):

其中 是原始样本, 是基向量, 是新表达。

数学表达:

其中 是行向量,表示第 个基, 是一个列向量,表示第 个原始数据记录.
当 时即 基的维度 < 数据维度时,可达到降维的目的。即:

以直角坐标系下的点(3,2)为例,欲将点(3,2)变换为新基上的坐标,就是用(3,2)与第一个基做内积运算,作为第一个新的坐标分量,然后用(3,2)与第二个基做内积运算,作为第二个新坐标的分量。

可以稍微推广一下,如果我们有m个二维向量,只要将二维向量按列排成一个两行m列矩阵,然后用“基矩阵”乘以这个矩阵,就得到了所有这些向量在新基下的值。例如(1,1),(2,2),(3,3),想变换到刚才那组基上,则可以这样表示:

回顾一下,我们的目的是希望在降维过程中损失最少,换言之,我们希望投影后的数据尽可能分散开。这种分散程度可以用方差来表达, 方差 越大,数据越分散。

随机变量 表达了 的取值与其数学期望之间的偏离程度。若 较小,意味着 的取值主要集中在期望 也就是 的附近,反之,若 较大,意味着 的取值比较分散。

为了避免过于抽象,我们以一个具体的例子展开。假设我们5个样本数据,分别是 ,将它们表示成矩阵形式:

为了后续处理方便,我们首先将每个字段内所有值都减去字段均值,其结果是将每个字段都变为均值为0.

我们看上面的数据,设第一个特征为 ,第二个特征为 , 此时某一个样本可以写作:
且特征 的均值为2, 特征 的均值为3,所以变换后:

协方差 (Covariance)在 概率论 和 统计学 中用于衡量两个变量的总体 误差 。

比如对于二维随机变量 ,特征 除了自身的数学期望和方差,还需要讨论 之间互相关系的数学特征。

当 时,变量 完全独立,这也是我们希望达到的优化目标。

方差 是协方差的一种特殊情况,即当两个变量是相同的情况:

对于 二维 随机变量 ,

对于 n维 随机变量 ,

可见,协方差矩阵是 行 列的对称矩阵,主对角线上是方差,而协对角线上是协方差。

依然我们以一个具体的例子展开,还是这5个样本数据, , ,将它们去中心化后表示成矩阵形式:

那如果有 个样本的话,

对 做一些变换,用 乘以 的转置,并乘上系数1/m:

这不正是协方差矩阵嘛!

现在我们可以说:

回顾一下:

设 的协方差矩阵为 , 的协方差矩阵为 ,且 。






我们要找的 不是别的,而是能让原始协方差矩阵对角化的 。

现在所有焦点都聚焦在了 协方差矩阵对角化 问题上。

由上文知道,协方差矩阵 是一个是对称矩阵,在线性代数上,实对称矩阵有一系列非常好的性质:

1)实对称矩阵不同特征值对应的特征向量必然正交。

2)设特征向量 重数为 ,则必然存在 个线性无关的特征向量对应于 ,因此可以将这 个特征向量单位正交化。

由上面两条可知,一个 行 列的实对称矩阵一定可以找到 个单位正交特征向量,设这 个特征向量为 ,我们将其按列组成矩阵:

则对协方差矩阵 有如下结论:

其中 为对角矩阵,其对角元素为各特征向量对应的特征值(可能有重复)。

结合上面的公式:

其中, 为对角矩阵,我们可以得到:

是协方差矩阵 的特征向量单位化后按行排列出的矩阵,其中每一行都是 的一个特征向量。如果设 按照 中特征值的从大到小,将特征向量从上到下排列,则用 的前 行组成的矩阵乘以原始数据矩阵 ,就得到了我们需要的降维后的数据矩阵 。

总结一下PCA的算法步骤:

设有 条 维数据。

1)将原始数据按列组成 行 列矩阵X

2)将 的每一行(代表一个特征)进行零均值化,即减去这一行的均值

3)求出协方差矩阵

4)求出协方差矩阵 的特征值及对应的特征向量

5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前 行组成矩阵

6) 即为降维到 维后的数据

这里以上文提到的:
,将它们表示成矩阵形式:

我们用PCA方法将这组二维数据其降到一维。

为了后续处理方便,我们首先将每个特征内所有值都减去字段均值,其结果是将每个字段都变为均值为0.

因为这个矩阵的每行已经是零均值,这里我们直接求协方差矩阵:

对于矩阵 :

和 分别是特征值和特征向量,
,则:

为了使这个方程式有非零解,矩阵 的行列式必须是 0

即:

则:

分解得:

找到2个特征值, , ,

when :

即:

则:

和 可以取任意值,我们取归一化的 和 ,即: ,
此时 和

when :

即:

则:

和 可以取任意值,我们取归一化的 和 ,即:
此时 和

所以:

可以验证协方差矩阵C的对角化:

最后我们用 的第一行乘以数据矩阵,就得到了降维后的表示:

降维投影结果如下图:

㈥ 什么是区块链最核心的内容

区块链最核心的内容是合约层
1、去中心化
这是区块链颠覆性特点,不存在任何中心机构和中心服务器,所有交易都发生在每个人电脑或手机上安装的客户端应用程序中。
实现点对点直接交互,既节约资源,使交易自主化、简易化,又排除被中心化代理控制的风险。
2、开放性
区块链可以理解为一种公共记账的技术方案,系统是完全开放透明的,
账簿对所有人公开,实现数据共享,任何人都可以查账。
区块链是透明共享的总帐本,这帐本在全网公开,你拿到它的公钥,你就知道它帐里面到底是有多少钱,所以任何一次的价值转换,全世界有兴趣的人都能在旁边看着你,转换是由矿工来帮你确认的,所以它是一个互联网共识机制。
3、不可撤销、不可篡改和加密安全性
区块链采取单向哈希算法,每个新产生的区块严格按照时间线形顺序推进,时间的不可逆性、不可撤销导致任何试图入侵篡改区块链内数据信息的行为易被追溯,导致被其他节点的排斥,造假成本极高,从而可以限制相关不法行为。
(6)pca+去中心化扩展阅读:
一,概念定义
什么是区块链?从科技层面来看,区块链涉及数学、密码学、互联网和计算机编程等很多科学技术问题。从应用视角来看,简单来说,区块链是一个分布式的共享账本和数据库,具有去中心化、不可篡改、全程留痕、可以追溯、集体维护、公开透明等特点。这些特点保证了区块链的“诚实”与“透明”,为区块链创造信任奠定基础。而区块链丰富的应用场景,基本上都基于区块链能够解决信息不对称问题,实现多个主体之间的协作信任与一致行动[7]。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),是比特币的一个重要概念,它本质上是一个去中心化的数据库。
二,特征
去中心化。区块链技术不依赖额外的第三方管理机构或硬件设施,没有中心管制,除了自成一体的区块链本身,通过分布式核算和存储,各个节点实现了信息自我验证、传递和管理。去中心化是区块链最突出最本质的特征。
开放性。区块链技术基础是开源的,除了交易各方的私有信息被加密外,区块链的数据对所有人开放,任何人都可以通过公开的接口查询区块链数据和开发相关应用,因此整个系统信息高度透明。
独立性。基于协商一致的规范和协议(类似比特币采用的哈希算法等各种数学算法),整个区块链系统不依赖其他第三方,所有节点能够在系统内自动安全地验证、交换数据,不需要任何人为的干预。
安全性。只要不能掌控全部数据节点的51%,就无法肆意操控修改网络数据,这使区块链本身变得相对安全,避免了主观人为的数据变更。
匿名性。除非有法律规范要求,单从技术上来讲,各区块节点的身份信息不需要公开或验证,信息传递可以匿名进行

㈦ 去中心化通俗解释是什么

去中心化就是不要中心。

引申义:随着主体对客体的相互作用的深入和认知机能的不断平衡、认知结构的不断完善,个体能从自我中心状态中解除出来,皮亚杰称之为去中心化。

节点之间彼此可... 这种开放式、扁平化、平等性的系统现象或结构,我们称之为去中心化。

(7)pca+去中心化扩展阅读:

在一个分布有众多节点的系统中,每个节点都具有高度自治的特征。节点之间彼此可以自由连接,形成新的连接单元。任何一个节点都可能成为阶段性的中心,但不具备强制性的中心控制功能。节点与节点之间的影响,会通过网络而形成非线性因果关系。这种开放式、扁平化、平等性的系统现象或结构,我们称之为去中心化。

随着主体对客体的相互作用的深入和认知机能的不断平衡、认知结构的不断完善,个体能从自我中心状态中解除出来,称之为去中心化。

㈧ 去中心化和中心化的具体概念是什么

去中心化:

相对于“中心化”概念,在去中心化的系统网络里,每一个参与者(节点)都是平等且自由的关系,没有谁依赖谁。

这就像朋友聚会,畅所欲言,你可以选择不说话,也可以选择中途离场;中心化则像是领导开会,一切全凭领导这个中心在会议上指示和安排。

中心化:

就是以一个节点为中心,向四周扩散开去。

注意事项:

相对于前期的互联网(Web 1.0)年代,今天的网络(Web 2.0)内容不再是由专业网站或特定人群所发生,而是由整体网民一起参加、权级相等的一起创造的成果。任何人,都能够在网络上表达自己的观点或创造原创的内容,一起生产信息。

跟着网络服务形状的多元化,去中心化网络模型越来越清晰,也越来越成为可能。Web2.0鼓起后,Wikipedia、Flickr、Blogger等网络服务商所供给的服务都是去中心化的,任何参加者,均可提交内容,网民一起进行内容协同创造或奉献。

㈨ 什么是去中心化

去中心化(英语:decentralization)是互联网发展过程中形成的社会关系形态和内容产生形态,是相对于“中心化”而言的新型网络内容生产过程。

相对于早期的互联网(Web 1.0)时代,Web 2.0内容不再是由专业网站或特定人群所产生,而是由权级平等的全体网民共同参与、共同创造的结果。任何人都可以在网络上表达自己的观点或创造原创的内容,共同生产信息。

随着网络服务形态的多元化,去中心化网络模型越来越清晰,也越来越成为可能。Web 2.0兴起后,Wikipedia、Flickr、Blogger等网络服务商所提供的服务都是去中心化的,任何参与者均可提交内容,网民共同进行内容协同创作或贡献。

之后随着更多简单易用的去中心化网络服务的出现,Web2.0的特点越发明显。例如Twitter、Facebook等更加适合普通网民的服务的诞生,使得为互联网生产或贡献内容更加简便、更加多元化,从而提升了网民参与贡献的积极性、降低了生产内容的门槛。最终使得每一个网民均成为了一个微小且独立的信息提供商,使得互联网更加扁平、内容生产更加多元化。

基本性质

去中心化,不是不要中心,而是由节点来自由选择中心、自由决定中心。简单地说,中心化的意思,是中心决定节点。节点必须依赖中心,节点离开了中心就无法生存。在去中心化系统中,任何人都是一个节点,任何人也都可以成为一个中心。任何中心都不是永久的,而是阶段性的,任何中心对节点都不具有强制性。

阅读全文

与pca+去中心化相关的资料

热点内容
数字货币交易所吃客损 浏览:475
耐普矿机是哪年上市的 浏览:324
以太坊钱包空降币 浏览:213
eco数字货币是什么意思 浏览:893
魔兽怀旧服中级挖矿去哪里挖 浏览:415
鸿博股份区块链 浏览:742
aot慈善币1月19日矿机 浏览:973
现在哪个比特币网可以交易 浏览:18
挖矿币开盘怎么写开盘词 浏览:421
矿机传媒广告背包 浏览:242
数字货币交易所MSOKEN 浏览:664
比特币病毒2017 浏览:729
40万蚂蚁矿机 浏览:623
比特币钱包签名怎么搞 浏览:586
数字货币最收藏价值 浏览:786
区块链node 浏览:722
比特币挖矿对气候 浏览:320
购买比特币属于诈骗类的那种 浏览:772
btc图表怎么看 浏览:144
俄罗斯科学家计算机挖矿 浏览:761