比特币大数据 究竟隐藏了多少秘密?

2009年1月3日,中本聪在芬兰赫尔辛基某小型服务器中挖出了50枚比特币,翻开了区块链技术的序幕。时光飞梭,经历了屡次的起起伏伏,比特币迎来了10周年生日。

2009年1月3日,中本聪在芬兰赫尔辛基某小型服务器中挖出了50枚比特币,翻开了区块链技术的序幕。时光飞梭,经历了屡次的起起伏伏,比特币迎来了10周年生日。

火币研究院通过汇总十年来的比特币数据,包括比特币链上数据,交易平台的交易数据以及全球最早的比特币论坛Bitcointalk数据,得出了一些有趣的结论。

 01 

有多少比特币在“沉睡”?

1、沉睡的比特币占所有流通比特币的比例

比特币的公钥和私钥由椭圆曲线加密算法生成,私钥可推出公钥而反之不能,由于早期人们对比特币私钥保存的意识薄弱,助记词、多重签名等保险手段未得到普及,所以,在比特币网络早期,一旦忘记秘钥或者丢失存储秘钥的硬件,找回比特币几乎是不可能的事情。

关于有多少比特币在沉睡,其中又有多少已经永久遗失,一直是数字货币爱好者们津津乐道的话题。

通过抓取比特币网络从创世区块以来所有的链上数据,对未花费(Unspent)的比特币数量按时间进行类了统计。

比特币大数据

如果我们按照年份来区分,可以看出:沉睡的比特币有两个波峰,一个是2009年即比特币创世之年,另一个为2013年,也就是比特币迎来真正意义上的第一波大牛市,当时价格最高达到1100美金。

比特币大数据

2、沉睡的比特币激活规律

比特币流通总量的1/4处于沉睡状态,其中,究竟有多少是忘记私钥、永久遗失的比特币呢?沉睡的比特币激活时间有没有规律可循?未遗失的比特币会不会集体套现,对市场造成巨大冲击?

带着这些问号,我们对最近一年内沉睡的比特币重新激活进行了探索。

2018年所有转账的比特币,共有104万个。2015年1月1日后沉睡的比特币,在2018年被激活的时间分布如下图。2018年沉睡的比特币被激活的波峰有四处,分别在1-2月,4-5月,8月与12月。

比特币大数据

 如果我们再对比比特币2018年的价格走势,巧合的是,四次激活的波峰中,前三次都正好处于比特币价格上涨/反弹的时点。

比特币大数据

2018年12月的沉睡的比特币激活较为特殊,截止12月13日为止,沉睡的比特币激活数量已经远超2018年所有月份,其中有很大部分的原因是Coinbase整理钱包,激活了大约15万-20万。

去除该部分,12月仍处于2018年的高峰。其中,已观察有部分2011-2013年矿工地址的沉睡比特币被转出。结合比特币价格数据,不排除因为比特币跌破6000美元支撑位后,部分早期矿工进行恐慌性抛售。

我们发现:2018年,在比特币币价下跌过程中的每次大幅反弹时,都会有沉睡地址的比特币被大量激活;在11月末比特币价格跌破6000美元心理支撑后,同样也有大量沉睡地址的比特币被激活。

3、永久遗失的比特币数量

2011年之前的沉睡比特币激活数量几乎可以忽略不计,2013年和2014年的沉睡比特币重新激活百分比分别为26%与43.6%;2011年和2012年重新激活百分比为8.7%-8.8%;2009年和2010年重新激活百分比仅有0.3%与0.6%。

比特币大数据

2009年和2010年,共有187.3万个沉睡的比特币,2011年和2012年共有85万个,根据2018年沉睡激活的比例,我们推测2009和2010年大部分沉睡比特币可能已经丢失可能,2011年和2012年也有相当一部分已经丢失。

我们估测:总计已经无法找回的比特币数量,预计在200万-300万左右,占比特币总量约12%-18%。

 02 

这些年Bitcointalk论坛有哪些变化?

Bitcointalk.org是全球最早的比特币爱好者社区,在比特币发展的初期,中本聪就曾以"satoshi"的账号在此布道。

中本聪共计发表过19篇帖子,回复300多次。但在2010年10月之后,他隐退了。著名的“披萨事件”也发生在这个论坛里。

比特币大数据

1、每年话题数

论坛每年新发起的主题数目总体成上升趋势。截至目前,2018年的新增帖子数已经是2010年的31倍,几次峰值分别出现在比特币价格波动较大的年份(2011年、2013-2014年、2017-2018年)。

比特币大数据

2、每年活跃程度

活跃度是衡量论坛参与程度的重要指标之一。汇总每年所有主题的活跃度后,我们发现,2018年的表现尤为突出,为244万,是2010年比特币早期发展阶段的11倍。2017年虽然新增帖子数量很高,但活跃程度却有所欠缺。此外,2011年和2014年的表现同样亮眼。

比特币大数据

3、关键的意见领袖

话题总热度排名,旨在汇集作者名下所有帖子的活跃度,也可以理解为影响力,筛选出论坛中的头部用户和话题领袖。

除去匿名用户,热度最高的三位分别是Gavin Andresen、Phinnaeus Gage和Zhoutong。在排行榜中,不仅有早期贡献者,如“satoshi”、“NewlibertyStandard”,也有后来的话题领袖,如“Huobi-USD”、“shamzblueworld”。

发帖最多的前五名用户,分别是:

“rickbig41”,“Bitcoinpro”,“OmegaStarScream“,“remotemass”,“alyssa85”。其中,“rickbig41”是论坛管理员。

比特币大数据

综合影响力之后,我们可以发现,发帖数量与影响力并不构成绝对的正向关系,但高产作者的影响力普遍较高,其中不乏在热度排行榜中的意见领袖,比如:“Phinnaeus Gage”、“Elwar”、“OmegaStarScream”等。

4、部分意见领袖代表的介绍

1)Satoshi

中本聪的活跃时间是2010年,主要发布了一些关于比特币的介绍、问题解答和版本更新的内容。其中,热度最高的是论坛的第一篇帖子:欢迎来到新的比特币论坛!共收获161个回复和63000多次的浏览。最后一篇文章是比特币0.3.19版本的介绍。

比特币大数据

2)Gavin Andresen

在中本聪退出之后,Gavin Andresen接任比特币开发者领导之位,并于2014年退出。在这段时间里,他共发起了47个主题,并位列关注度排行的第一名。Gavin Andresen的帖子,大部分都是比特币版本更新的内容,还有一部分是行业动态和自己的参会行程。

3)“zhoutong”

周同自称是一个19岁的新加坡华人(2012年)。他最早开设了比特币融资平台Bitcoinica,并围绕比特币推出了一系列衍生品。2012年,Bitcoinica发布公告称遭受黑客攻击,比特币被洗劫一空,周同也在2013年消失。他在论坛中的帖子,主要围绕Bitcoinica展开,最后一篇帖子“我将要离开比特币”引起了激烈反响。

 03 

论坛上的帖子都在讨论啥?

纵观Bitcointalk近五万篇帖子的标题,“bitcoin”以25057次占据榜首,第二名“btc”则出现了3100次。排除比特币之后,其余词频排行如下:

比特币大数据

前三名分别是“blockchain”、“crypto”、“price”,一些热点事件,如“mtgox”和“segwit”也出现在了榜上。

以下是每年的词频变化:

1、2010年

这一年,比特币仅被极少数的极客知晓,论坛也刚刚建立,所以讨论人数不多。因为中本聪推出比特币时,将它定义为一种点对点的电子现金系统,货币、支付、系统等单词在这一年被提到最多次。

比特币大数据

2、2011年

门头沟(Mt.Gox)曾经是世界上最大的比特币交易商,而2011年是它迅猛发展的一年,这一年也是交易所发展的一年。从词频中可以看出,因为各种交易平台的上线,从2010年到2011年,比特币相比购买披萨时的价格上涨了一万倍,最高达到31.9美元,直到门头沟爆发黑客事件。

比特币大数据

3、2012年

受黑客事件的影响,加密货币的安全性受到了投资者们的质疑,币价持续走低,并在2012年初跌破了2美元。人们开始不相信交易平台,转而对钱包和安全性产生了需求,这一年的年度热词中,“钱包”一词占据榜首。

比特币大数据

4、2013年

钱包、中本聪、货币等词占据榜单前列,除了关心钱包问题外,人们开始竞相猜测中本聪的真实身份。这一年,一部分欧洲国家接连出台了比特币发行政策,比特币的价格一路走高,并在年底突破了1147美元。随着中国对比特币的影响力逐渐增加,“中国”一词被提及59次,处于排行榜前列。

比特币大数据

5、2014-2016年

这段时间,区块链超越中本聪和钱包,成为被提及次数最多的单词。这可能是因为2014年到2016年,比特币市场持续低迷,一度跌至200美元,仍然坚守的人转而开始思考区块链这一革命性技术的未来。

比特币大数据

6、2017年

2017年,隔离见证、分叉、价格新晋排行榜榜首,其中隔离见证是因为这一年关于SegWit的讨论持续了很久,分叉是由于各种分叉币、山寨币的涌现,价格则是因为2017年是比特币的大牛市,人们讨论币价的热情空前高涨。

比特币大数据

7、2018年

随着整个加密货币生态体系的逐渐完善,Crypto密码和区块链以绝对优势占据了榜单的前两名,人们的目光已经不仅仅局限于比特币本身。虽然比特币在暴跌之后步入了熊市,但它所代表的去中心化理念和带来的关注永远不会消失,论坛上每个的单词都是区块链发展的缩影。

比特币大数据

你预测,2019年Bitcointalk论坛上出现最多的三个词会是哪三个?欢迎在留言区留言。

生成图片
1

发表评论

比特币大数据 究竟隐藏了多少秘密?

星期六 2019-01-12 18:35:57

2009年1月3日,中本聪在芬兰赫尔辛基某小型服务器中挖出了50枚比特币,翻开了区块链技术的序幕。时光飞梭,经历了屡次的起起伏伏,比特币迎来了10周年生日。

火币研究院通过汇总十年来的比特币数据,包括比特币链上数据,交易平台的交易数据以及全球最早的比特币论坛Bitcointalk数据,得出了一些有趣的结论。

 01 

有多少比特币在“沉睡”?

1、沉睡的比特币占所有流通比特币的比例

比特币的公钥和私钥由椭圆曲线加密算法生成,私钥可推出公钥而反之不能,由于早期人们对比特币私钥保存的意识薄弱,助记词、多重签名等保险手段未得到普及,所以,在比特币网络早期,一旦忘记秘钥或者丢失存储秘钥的硬件,找回比特币几乎是不可能的事情。

关于有多少比特币在沉睡,其中又有多少已经永久遗失,一直是数字货币爱好者们津津乐道的话题。

通过抓取比特币网络从创世区块以来所有的链上数据,对未花费(Unspent)的比特币数量按时间进行类了统计。

比特币大数据

如果我们按照年份来区分,可以看出:沉睡的比特币有两个波峰,一个是2009年即比特币创世之年,另一个为2013年,也就是比特币迎来真正意义上的第一波大牛市,当时价格最高达到1100美金。

比特币大数据

2、沉睡的比特币激活规律

比特币流通总量的1/4处于沉睡状态,其中,究竟有多少是忘记私钥、永久遗失的比特币呢?沉睡的比特币激活时间有没有规律可循?未遗失的比特币会不会集体套现,对市场造成巨大冲击?

带着这些问号,我们对最近一年内沉睡的比特币重新激活进行了探索。

2018年所有转账的比特币,共有104万个。2015年1月1日后沉睡的比特币,在2018年被激活的时间分布如下图。2018年沉睡的比特币被激活的波峰有四处,分别在1-2月,4-5月,8月与12月。

比特币大数据

 如果我们再对比比特币2018年的价格走势,巧合的是,四次激活的波峰中,前三次都正好处于比特币价格上涨/反弹的时点。

比特币大数据

2018年12月的沉睡的比特币激活较为特殊,截止12月13日为止,沉睡的比特币激活数量已经远超2018年所有月份,其中有很大部分的原因是Coinbase整理钱包,激活了大约15万-20万。

去除该部分,12月仍处于2018年的高峰。其中,已观察有部分2011-2013年矿工地址的沉睡比特币被转出。结合比特币价格数据,不排除因为比特币跌破6000美元支撑位后,部分早期矿工进行恐慌性抛售。

我们发现:2018年,在比特币币价下跌过程中的每次大幅反弹时,都会有沉睡地址的比特币被大量激活;在11月末比特币价格跌破6000美元心理支撑后,同样也有大量沉睡地址的比特币被激活。

3、永久遗失的比特币数量

2011年之前的沉睡比特币激活数量几乎可以忽略不计,2013年和2014年的沉睡比特币重新激活百分比分别为26%与43.6%;2011年和2012年重新激活百分比为8.7%-8.8%;2009年和2010年重新激活百分比仅有0.3%与0.6%。

比特币大数据

2009年和2010年,共有187.3万个沉睡的比特币,2011年和2012年共有85万个,根据2018年沉睡激活的比例,我们推测2009和2010年大部分沉睡比特币可能已经丢失可能,2011年和2012年也有相当一部分已经丢失。

我们估测:总计已经无法找回的比特币数量,预计在200万-300万左右,占比特币总量约12%-18%。

 02 

这些年Bitcointalk论坛有哪些变化?

Bitcointalk.org是全球最早的比特币爱好者社区,在比特币发展的初期,中本聪就曾以"satoshi"的账号在此布道。

中本聪共计发表过19篇帖子,回复300多次。但在2010年10月之后,他隐退了。著名的“披萨事件”也发生在这个论坛里。

比特币大数据

1、每年话题数

论坛每年新发起的主题数目总体成上升趋势。截至目前,2018年的新增帖子数已经是2010年的31倍,几次峰值分别出现在比特币价格波动较大的年份(2011年、2013-2014年、2017-2018年)。

比特币大数据

2、每年活跃程度

活跃度是衡量论坛参与程度的重要指标之一。汇总每年所有主题的活跃度后,我们发现,2018年的表现尤为突出,为244万,是2010年比特币早期发展阶段的11倍。2017年虽然新增帖子数量很高,但活跃程度却有所欠缺。此外,2011年和2014年的表现同样亮眼。

比特币大数据

3、关键的意见领袖

话题总热度排名,旨在汇集作者名下所有帖子的活跃度,也可以理解为影响力,筛选出论坛中的头部用户和话题领袖。

除去匿名用户,热度最高的三位分别是Gavin Andresen、Phinnaeus Gage和Zhoutong。在排行榜中,不仅有早期贡献者,如“satoshi”、“NewlibertyStandard”,也有后来的话题领袖,如“Huobi-USD”、“shamzblueworld”。

发帖最多的前五名用户,分别是:

“rickbig41”,“Bitcoinpro”,“OmegaStarScream“,“remotemass”,“alyssa85”。其中,“rickbig41”是论坛管理员。

比特币大数据

综合影响力之后,我们可以发现,发帖数量与影响力并不构成绝对的正向关系,但高产作者的影响力普遍较高,其中不乏在热度排行榜中的意见领袖,比如:“Phinnaeus Gage”、“Elwar”、“OmegaStarScream”等。

4、部分意见领袖代表的介绍

1)Satoshi

中本聪的活跃时间是2010年,主要发布了一些关于比特币的介绍、问题解答和版本更新的内容。其中,热度最高的是论坛的第一篇帖子:欢迎来到新的比特币论坛!共收获161个回复和63000多次的浏览。最后一篇文章是比特币0.3.19版本的介绍。

比特币大数据

2)Gavin Andresen

在中本聪退出之后,Gavin Andresen接任比特币开发者领导之位,并于2014年退出。在这段时间里,他共发起了47个主题,并位列关注度排行的第一名。Gavin Andresen的帖子,大部分都是比特币版本更新的内容,还有一部分是行业动态和自己的参会行程。

3)“zhoutong”

周同自称是一个19岁的新加坡华人(2012年)。他最早开设了比特币融资平台Bitcoinica,并围绕比特币推出了一系列衍生品。2012年,Bitcoinica发布公告称遭受黑客攻击,比特币被洗劫一空,周同也在2013年消失。他在论坛中的帖子,主要围绕Bitcoinica展开,最后一篇帖子“我将要离开比特币”引起了激烈反响。

 03 

论坛上的帖子都在讨论啥?

纵观Bitcointalk近五万篇帖子的标题,“bitcoin”以25057次占据榜首,第二名“btc”则出现了3100次。排除比特币之后,其余词频排行如下:

比特币大数据

前三名分别是“blockchain”、“crypto”、“price”,一些热点事件,如“mtgox”和“segwit”也出现在了榜上。

以下是每年的词频变化:

1、2010年

这一年,比特币仅被极少数的极客知晓,论坛也刚刚建立,所以讨论人数不多。因为中本聪推出比特币时,将它定义为一种点对点的电子现金系统,货币、支付、系统等单词在这一年被提到最多次。

比特币大数据

2、2011年

门头沟(Mt.Gox)曾经是世界上最大的比特币交易商,而2011年是它迅猛发展的一年,这一年也是交易所发展的一年。从词频中可以看出,因为各种交易平台的上线,从2010年到2011年,比特币相比购买披萨时的价格上涨了一万倍,最高达到31.9美元,直到门头沟爆发黑客事件。

比特币大数据

3、2012年

受黑客事件的影响,加密货币的安全性受到了投资者们的质疑,币价持续走低,并在2012年初跌破了2美元。人们开始不相信交易平台,转而对钱包和安全性产生了需求,这一年的年度热词中,“钱包”一词占据榜首。

比特币大数据

4、2013年

钱包、中本聪、货币等词占据榜单前列,除了关心钱包问题外,人们开始竞相猜测中本聪的真实身份。这一年,一部分欧洲国家接连出台了比特币发行政策,比特币的价格一路走高,并在年底突破了1147美元。随着中国对比特币的影响力逐渐增加,“中国”一词被提及59次,处于排行榜前列。

比特币大数据

5、2014-2016年

这段时间,区块链超越中本聪和钱包,成为被提及次数最多的单词。这可能是因为2014年到2016年,比特币市场持续低迷,一度跌至200美元,仍然坚守的人转而开始思考区块链这一革命性技术的未来。

比特币大数据

6、2017年

2017年,隔离见证、分叉、价格新晋排行榜榜首,其中隔离见证是因为这一年关于SegWit的讨论持续了很久,分叉是由于各种分叉币、山寨币的涌现,价格则是因为2017年是比特币的大牛市,人们讨论币价的热情空前高涨。

比特币大数据

7、2018年

随着整个加密货币生态体系的逐渐完善,Crypto密码和区块链以绝对优势占据了榜单的前两名,人们的目光已经不仅仅局限于比特币本身。虽然比特币在暴跌之后步入了熊市,但它所代表的去中心化理念和带来的关注永远不会消失,论坛上每个的单词都是区块链发展的缩影。

比特币大数据

你预测,2019年Bitcointalk论坛上出现最多的三个词会是哪三个?欢迎在留言区留言。