关于个人数据资产管理的思考

  • A+
所属分类:大数据 行业应用
前言

数千年来,绝大多数人的生活轨迹燕过无痕,消失在时间和记忆中,偶有的吉光片羽则散落在各种难以计数的书册中长眠。

然而,这一传统已被彻底颠覆。越来越多的个人行为被记录和存储在联网的比特世界中。

智能手机捕捉了通话、短信以及使用软件的习惯;手机上的各类传感器在收集各种信息,譬如GPS收集了我们的地理位置,摄像头则保留了视觉记忆;社交网络保存了人们的个人档案、社会关系、职业经历、个人喜好;银行拥有我们的消费记录;医院留存了我们的健康信息……

这些个人数据揭示着我们是谁,认识哪些人,有怎样的生活形态。虽然目前这些海量信息仍然呈现出较为杂乱的无序状态,然而各种数据整合和分析的技术已经层出不穷,帮助各种机构进一步理解甚至预测人们的行为,并勾勒出一条条过去被隐藏的现实世界运行的逻辑。

这可以让商业机构通过精准营销或提供个人定制化的服务来赚取更多利润;让政府更高效地改进公共设施;让研究机构加速开发药品和治疗手段。关于如何整合和利用个人数据的生态系统本身,也将成为全新的产业机会。

因此,个人数据正在促成一波新的创造财富和社会价值的机会。

数千年来,绝大多数人的生活轨迹燕过无痕,消失在时间和记忆中,偶有的吉光片羽则散落在各种难以计数的书册中长眠。

然而,这一传统已被彻底颠覆。越来越多的个人行为被记录和存储在联网的比特世界中。

智能手机捕捉了通话、短信以及使用软件的习惯;手机上的各类传感器在收集各种信息,譬如GPS收集了我们的地理位置,摄像头则保留了视觉记忆;社交网络保存了人们的个人档案、社会关系、职业经历、个人喜好;银行拥有我们的消费记录;医院留存了我们的健康信息……

这些个人数据揭示着我们是谁,认识哪些人,有怎样的生活形态。虽然目前这些海量信息仍然呈现出较为杂乱的无序状态,然而各种数据整合和分析的技术已经层出不穷,帮助各种机构进一步理解甚至预测人们的行为,并勾勒出一条条过去被隐藏的现实世界运行的逻辑。

这可以让商业机构通过精准营销或提供个人定制化的服务来赚取更多利润;让政府更高效地改进公共设施;让研究机构加速开发药品和治疗手段。关于如何整合和利用个人数据的生态系统本身,也将成为全新的产业机会。

因此,个人数据正在促成一波新的创造财富和社会价值的机会。

最近的一个思考。

数据作为资产在企业早已热火朝天,甚至于把口号喊得震天响,但似乎还没有看到针对用户级别的数据资产管理产品出现。

关于个人数据资产管理的思考

一、数据为何是资产

看了不少相关资料,我觉得一个商品成为资产的过程,一定是先有价值,清晰的所有权归属,以及有合理可接受的计价模型。

1.价值

互联网预言家凯文凯利说,不管你现在做什么行业,你做的生意都是数据生意。过去的企业关键词是项目,现在的企业关健词是数据。

前面我有过一篇文章阐述过拜数据教的思想:

世间的一切学科,无论是科学、文学、音乐还是经济学,背后都是数学模式。从数学角度,我们可以把一个人、一个动物、一个公司或国家都想象成一个数据处理系统。

同样,传统企业在运行中所有的生产资料的信息流,人、财、物,都可以沉淀转变为一种新的生产资料——数据资料。于是,越来越多的人把数据当做未来商业的石油,只不过它跟石油有本质区别,石油越用越少,可数据越用越多。

2.产权归属

普遍来看,我们一般分为三方数据来讨论产权的归属问题。

一方数据:数据生产者自己生产的数据。企业的CRM,供应链,阿里,百度的用户数据。应该说一方数据产权是明确,属于生产者所有。生产者负责了数据的生产采集清洗应用赋能等一系列流程。

二方数据:第三方统计分析公司,比如google分析,百度统计,友盟,growingio等,另外还有针对H5分析的斐波那契等平台。对于二方数据来说,产权其实是有争议的。拿百度统计举例,网站接入了百度统计,百度拿到的这一部分数据是不是有所有权,使用权,甚至于公开买卖,对于网站的所有者来说,是有一定损失的。所以,在接入分析之前,应该要有一定的权限界定。

三方数据:通过第三方购买数据,爬虫爬取数据等。很明显,三方数据的产权归属更为模糊。只能通过一些协议来规范,比如网页爬虫就有robot协议等,当然也有一些流氓的搜索爬虫,无视网页的robot协议。

个人数据资产在这三方数据中,应该更多的处于一方数据的地位,我们在接下来要继续讨论。

3.如何定价

作为资产,当然最难的就是如何进行估值定价了。我们可以先来看下数据的普遍增值方式是哪些。

第一,数据租售。通过对业务数据进行收集、整理、过滤、校对、打包、发布等等一系列整理,实现数据内在的价值。

第二,信息租售。通过聚焦行业焦点,收集相关数据,深度整合、萃取及分析,形成完整数据链条,实现数据的资产转化。

第三,数据使能。是指类似于阿里这样的互联网公司,通过提供大量的金融数据挖掘及分析服务,为传统金融行业难以下手的小额贷款业务,开创新的行业增长点。或者利用数据来提升自身产品的体验。

在现代经济学中,关于资产定价有大卫李嘉图的劳动价值论。大意是这样的,资产的价值是由劳动创造的,也就是商品的价值由生产该项商品的社会必要劳动时间所决定。

直观来看,因为数据租售与信息租售能产生较稳定的现金流。于是,作为财务分析来看,其定价更为方便。于是,这当中如何进行账务处理,并归入企业利润表、现金流量表以及资产负债表中,只需进行相应的财务分析即可。相反,数据使能的计价模型则比较复杂,并且由于数据目前来看仍具有稀缺性,导致定价依旧比较困难。看来我要重新温习下CAMP这一类资产定价模型了。

二、企业的数据资产中存在大量的个人劳动

不知道大家有没有听过一个词,data labor,数据劳工。它的意思是,我们每个人使用各种互联网产品,其实同时充当了一个数据劳工的角色,在给互联网企业提供了非常多的数据资料,而且这个劳工还是免费的。当然,也有付费的数据劳工。

1.免费的数据劳工

有这样两个小例子。

第一是电商企业。他们前期通过搜索与电商,采集了大量用户行为数据。借助支付,快递,收集到银行卡,家庭,公司等一系列个人数据。后期通过数据挖掘,进行商品推荐,广告,金融等不同程度的变现。

第二是Facebook News feed。FB的NewsFeed目标是将最好的内容向每个人展示。但前提理解内容(NLU,Natural Language Understanding),理解人。怎么做呢,他们需要很多用户的点击、反馈、停留等一系列数据,利用这些数据去做到Understanding,达到内容与人的匹配。在未来,他肯定是最了解你的,因为你跟他的相处的最多。于是,你可能会离不开一个很了解你的机器。因此,一个产品的竞争不再是内容,而是他拥有了你再也离不开的数据。

2.付费的数据劳工

人工智能这么火,不知道有多少人知道ImageNet这个项目,要想做到图片分类与理解,其实是需要大量已经标注好的图片数据。在八年前,实际上是没有这么多优质的图片库的。

于是李飞飞老师通过Amazon、土耳其机器人(Mechanical Turk)等平台,雇佣了来自世界上167个国家,接近5万个工作者,帮助他们进行筛选,排序,标注了接近十亿张图片。

于是,现在利用深度学习等技术,计算机开始可以阅读图片了,知道原来这张图片就是猫。

这就是一个典型的付费数据劳工例子。此外还有Netflix需要的电影评价,科大讯飞需要的语音数据,其实都雇佣了数据劳工。

三、未来的个人数据资产管理机构

目前来看,有这么几类数据是企业花费了大量人力物力进行收集处理,并且已经有大规模的应用。

1.个人的标签数据,用户画像

对于大部分互联网公司来说,用户数据的一个应用就是用户画像,打标签是用户画像的基础工作。互联网公司会通过你的点击,浏览,停留,收藏,购买等一系列行为,分析你的喜好,给你打上特定的标签。可是,由于某些公司用户数据的不足,输出的用户画像系统是有偏差的,应该说算法跑出的结果,肯定不如人为填写的准确。

2.个人的健康数据

比如每天都在使用的小米手环。这一类产品是能源源不断的监测你的日常的某一类身体指标数据,并且在未来提供一个track的功能。

一个最明显的例子。我们可能大部分人都有寻找某样物品的时候。这个时候,如果时间能够回放,能够看到当初我们把这件物品反正哪个地方,我们就可以节约很多时间,物品也能快速找回。

这一类健康的硬件就是帮助你这件事情。于是,你每天源源不断的提供着这些健康数据,未来某一天,你肯定需要这些数据的回放,需要分析某一种疾病的构成原因。管理好自身的健康数据,很快,它将是你的数据资产。

3.个人数据资产管理平台

上个世纪,大家还都把钱放在枕头底下,原因是不信任银行,也不觉得银行会比自己管钱管的好,现在已经没有人会傻到继续把钱放在枕头底下了。

可见,个人数据的未来一样也需要这样的个人数据管理平台。数据有其专业性,数据需要存储、交换、分析、识辨,个人管理不了自身的数据是一定的,委托并授权给相应的数据管理机构是大势所趋。

4.C2B or C2C的商业模式

那个人的数据如何变现,资产如何保值增值?

个人把自身数据授权给个人数据资产管理平台,由平台进行统一管理,打破数据孤岛,打通巨头间的数据共享。

举例来说,你之前一直都在使用信用卡,某张信用卡额度已经达到了十万以上。但是微粒贷跟蚂蚁花呗的额度一直很低,因为你电商购买的数据不足,或者没有在线上进行资产证明,所以不足以给你高额度。于是,你个人提供了银行的证明,提交到个人数据资产管理平台,由平台与第三方机构协商,提升网络信用额度。抽象来看,类似借贷宝这一类熟人借贷平台,无非就是你对熟人掌握了更多数据,于是你就有了更大的信心去借款给他。

再比如。今日头条现在想经营电商广告,但缺少你相关的商品数据,任他人工智能技术再强,也无法做好电商模块的个性化广告推荐。通过数据管理平台的授权,由个人出售自身一部分标签数据,这样今日头条才有可能补齐缺失的数据模块的短板。

由个人的数据授权与提供去打破目前互联网数据孤岛问题,进而享受到更好的服务,应该是一种思考的方向。

期待这一天的早日到来,或者我们自己做个APP?现在就差个程序员了。

End.

作者:郑耀宏

误差分位数的默示有效估计与\ 自回归时间序列的预测区间
2016年度中国软件开发者白皮书下载(PDF)
深入浅出数据分析(中文版)
小额消费信贷用户数据

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: