CDA数据分析师 出品
编译:Mika
【导读】
Jer Thorp是来自加拿大温哥华的艺 术家和教育家,目前居住在纽约。他的可视化 艺术实践中探索了科学和艺术之间的多重边界。 在本文中他分享了数据背后所蕴含的令人意想不到的重量。
点击下方视频,先睹为快
关于数据和历史
今天我想跟大家聊聊两件非常振奋人心的内容,你们可能已经猜到是什么了,那就是数据和历史。
我不是个历史学家,我不是来跟你们讲历史定义的,而是想让你们通过一个框架看待历史。
当我们创造历史,或是撰写历史文献时,我们是在把过去发生的事衔接在一起变成一个故事。
让我先来讲一个我自己的故事。和大多数年龄相仿的计算机工作者一样,我曾是个善于社交、受欢迎的年轻人,而且擅长运动的年轻人。和大多数年龄差不多的同行一样,我深受苹果公司的影响。
但是注意看我选的这个商标,左边那个苹果,不是右边那个。我深受右边那个苹果的影响,就像每个人一样。但是左边那个苹果,看看这标志,是个彩虹,但是顺序是错的!真不知道苹果公司是怎么想的。
我的第一台电脑
但对苹果公司我不想说太多,我想跟你们说一个机器的事儿。我现在回过头来想,真是不可思议啊!那是一个周三,是我大概12岁的时候,我还没有电脑。到了周四,我就有了一台电脑。
你能想象这变化吗?翻天覆地的变化。没有事物可以像电脑那样改变我们的生活。
但我其实也不想聊电脑的事儿,我想聊聊电脑上的一个程序。程序的创始人不是左边那个,右边那个才是。大家知道右边那人是谁吗?从来都没人知道,这是比尔·阿特金森。多亏比尔·阿特金森做的很多事,才有了我们现在每天在电脑上看到的东西。
▲乔布斯和HyperCard的开发人员比尔·阿特金森
但是我想重点说说比尔写的一个程序叫做 HyperCard。HyperCard 曾是苹果电脑的附赠品,为苹果电脑使用者设计的,在电脑上编程时用。
▲HyperCard
如今听起来很疯狂,这些程序不是我们如今使用的app。app是有很大的预算和传播度的,而这些程序只是很小的程序。有人用它来记录当地篮球赛的比分,有人用来整理论文,有人用来做古典音乐的教学,或者计算奇怪的天文日期。
当然还有一些是艺术项目,这是我最喜欢的一个叫做“If Monks Had Macs”,是个非线性探索环境。
▲If Monks Had Macs
HyperCard让我感激我能生在这个时代,让我有机会使用HyperCard。Hypercard是最后一个电脑自带的,设计给用户编程的附赠品。如果你告诉电脑的发明者们有那么一日,所有人都有了电脑,却没人知道如何编程,他们一定会觉得你疯了。
我的职业生涯与数据
让我们快进几年,我最初的职业是艺术家。我用电脑创作一些小玩意儿,比如研究植物的生长系统。还有在这个例子中,我用像素间的颜色互换来模拟经济模式,调查这些系统是如何运作的,我乐在其中。
这个项目使我开始从事数据相关的工作,我对这些图像的美观性也很感兴趣,这是伊朗和伊拉克。这个看起来像个钟表,叫做“钟表图”。这是另一个钟表图的例子,在“希望”上叠加“绝望”。实际上是在“希望”上叠加"危机”,“希望”只有三次被"危机"覆盖。
这一系列纽约时报作品的巅峰是几年前,我尝试把一整年的新闻整合到一张图中。于是这一整年的新闻人物,以及他们之间的关系都在这一张图里了。
推特可视化案例-「刚刚到达」
由此,我对更活跃的系统产生了兴趣。这个项目叫“刚刚到达”。我看人们发推特“我刚飞到夏威夷!”——你们懂的,人们总是不经意地在推特上谈到这些。“我真的不是在炫耀,但我刚到夏威夷“。
▲推特可视化项目--「刚刚到达」
然后我开始描绘人们的旅程,希望可以利用社交网络和背后的数据建立个模型来跟踪人们的动向。对流行病学家来说,这将是十分宝贵的信息。
推特可视化案例-「互道早安」
这是个类似的项目——它更有趣。在推特上看世界各地的人们互道早安。顺便说一句,我才知道在温哥华西岸的人真的比东岸的人起床晚,互相道早安也晚,东岸的人也更有冒险精神。
▲推特可视化项目「互道早安」
再给你们看一个项目,这个可能更实用,我试图把开普勒项目的数据做成更易懂的图像。我刚才给你们看的所有作品,都是做着玩的。
听起来有点奇怪,但这就像HyperCard。我自己创造一些工具,然后我可以和一些人分享。但都是为了自己开心,做着玩的。
所以其实很难给这些工具明确的定位,我的创作介于科学、艺术和设计之间。从HyperCard开始直到今天,我都在建立可视化工具来帮助我理解各种系统。
如今我在纽约时报工作,我是个数据艺术家。工作期间,我接触到很多有趣的项目。
信息传播可视化项目-Cascade
今天会给你们看其中两个。第一个是和马克·汉森一起做的,马克是加州洛杉矶的统计学教授和传媒艺术家。马克来时报时提过一个有趣,而又似乎显而易见的问题。当人们在网上传播信息时,信息是如何从A传到B,或从A传到B、C、D的?
我们都知道人们在网络上分享信息,却不知道传播过程中发生了什么。所以我们决定创造工具来探索这个问题,这个工具叫做Cascade。
我们看这些系统时,一件事导致另一些事,我们称之为建立Cascade。这些Cascade是逐渐发生的,所以我们的跟踪建模也需要一段时间。
▲Cascade
很多人都在传播纽约时报上的信息,因此Cascade看起来其实是这样的。这是个常见的Cascade,最左下方是第一个事件,当信息从一个人传播到另一个人时,这个点向上沿y轴延伸 y轴是分离程度。同时向x轴延伸 x轴是时间。
现在我们可以从很多角度看这个问题,这是线型角度,这个是把线型堆叠,成为这样的立体角度。
今天,时报每个月发表约7000篇文章,所以建立这个工具时很重要的一点是,把它建成一个可探索的模型,这样人们可以在大量数据中挖掘他们需要的信息。
就像是给人们提供了一辆车,在这大量的数据中畅通无阻,这样人们可以在大量数据中挖掘他们需要的信息。
实况中的Cascade 看起来是这样的。
不得不说,这是一个重要的时刻。那么久以来,我们接受了太多假新闻。所以当我们第一次看到这一幕时,就好像考古学家把灰尘从恐龙骨架上抖落一样。
我们发现了并第一次看到,这些网络共享信息的结构。拿恐龙来打比方好像挺合适的,因为我们是在对这些事之间的关联,做概率性的推测。当我们看着这些碎片信息做出假设时,我们尽力确保它们的严谨性。
推特是故事的一部分,叙事的一部分。我们在创建历史,但它们不过是短暂的历史。
这些大型的Cascades往往是最有趣的,当然有些小型的Cascades 也是很有意思的。这是我很喜欢的一个 叫“rabbi cascade”。是拉比们(犹太教学者) 围绕纽约时报中的一篇文章的对话。
实际上,宗教工作者休息时间非常有限,周六和周日他们好像不太能放假。
于是在这个Cascade里,有一群拉比在谈论一个纽约时报发表的故事。其中一个拉比给自己取的推特用户名很厉害叫“ The Velveteen Rabbi” (注:Velve teen Rabbit/绒布小兔子是一本英国儿童读物,此处取名去掉了t)。如果没有这个初步工具,我们永远不会找到这些信息,这些信息只会停留在某些角落,永不得见天日。把信息整合,然后建立叙事性结构,创作历史,我发现了无穷的乐趣。
9/11事件纪念碑可视化
我两年前搬到纽约,在纽约人人都有一个故事,是关于发生在2001年9月11日的那个重大事件。我自己的那个故事有些复杂,因为我花了很多时间在曼哈顿的9/11事件纪念碑。
9/11事件纪念碑的核心理念在于那些纪念碑上的名字,不是按字母顺序排列,也不是按年份排列,而是通过可以体现遇难者之间的关系的方式排列。弟兄和弟兄一起,同事和同事一起,所以这个纪念碑考虑了种种连接,这些人曾经在生活中的连接。
▲9/11事件纪念碑
我和一个叫做Local Projects的公司合作,做了一个算法软件,来帮助建筑师们决定这个纪念碑的排列方式。
一共有将近3000个名字,将近1500个邻接的请求。这些连接的请求,所以这是一个很密集的故事和叙事,需要在一个纪念碑上呈现。我和Jake Barton一起制作了这个软件,让建筑师可以首先制作一个可以满足所有请求的布局,然后在某些地方做改动,从而可以表达他们想要的故事。
我想在我们这个社交网络统领的时代,这个纪念碑是个与时俱进的概念。因为这些现实中的社交网络,在纪念碑中能够得以呈现。最令人感动的就是前去纪念碑,看到这些人的名字是如何彼此相邻,来呈现他们在世时的生活的。
▲9/11事件纪念碑
数据对我们生活的影响
那么,这些对于我们的生活有什么影响呢?
我不知道你们还记不记得,今年春天出了这么一件事,饱受争议。人们发现在iPhone上,还有在电脑上,有大量定位信息被储存。
苹果公司回应说,这些定位信息跟你们无关,而跟你们居所的无线网络有关。所以这跟你们无关,而是跟你们在哪有关。
这是很宝贵的数据,对研究者来说 这些移动数据像金子一样宝贵。于是我们想到:有多少人都在用iPhone啊?在座的有多少人用iPhone?所以在这个房间里,就有研究者们很喜欢的大量的定位信息。
于是我们创造了一个叫做Open Paths的系统,它可以让人们上传iPhone的数据,并与研究人员建立代理关系来共享这些数据,把这些信息贡献给有需要的人。
Open Paths的初步模型很成功,我们收到了成千套的数据。我们制作了一个界面,让人们可以看到自己的生活是如何展开的。从这些被你忽视在手机里的蛛丝马迹中。我们没有想到这个体验会是这样感人。
我上传数据的时候心想,没什么大不了的;我知道我住在哪;我知道我在哪上班;通过这个我能看到什么?
结果我看到了我来到纽约,走下飞机的那一刻,那一晚去吃泰餐的餐馆,想象着纽约新生活的开始。我遇到女友的那一天,这是拉瓜迪亚机场,这是在阿姆斯特丹大道上的泰国餐厅,这是我遇到我女友的时候。
你们看到了吗?我第一次讲这些故事和我第二次讲的时候,有什么区别?
我们不经意间,把这些信息放在了人类语境中,通过把信息放在生活语境中,信息就产生了意义,这非常非常重要。
因为我们的历史被保存在这些手机里,从这个角度来看这个人类语境的角度。
首先,我们可以更好理解我们,分享的是哪一类的信息,但如果我们可以把其他信息也放在人类语境中。我想很多事情都会被改变,因为它能自动让在这些系统的人们身临其境,这会导致最基本的尊重。
在我看来这一点在技术行业中往往是缺失的。当我们在处理一些事情,比如隐私时,如果我们明白数字不仅仅是数字,而是与现实连接在一起的,它们就变得举足轻重。有了这一层理解,对话就可以变得不同。
你们中多少人曾点过按钮,许可第三方公司获取你的定位信息的?很多人吧。第三方公司是开发商,第二方公司是苹果,可是第一方却从没有获得这些信息!
我想这是因为我们把这些信息看作是抽象的,可以被搁置不顾的,我们没有把它们放入人类语境中,使它们的价值变得更重要。我请求你们做的事很简单,从更人类语境的角度看待数据,这真的不难。
当你看到股价时,想一下背后的人类语境。当你看到贷款报告时,想一下背后的人类语境。
很显然,大数据是巨大的商业。一个产业巨头在崛起,想一想我们在之前的资源产业中做得如何,我们做得不好。我想一部分问题在于,我们没有积极参与到有关人文语境的各方面对话中。
我要请求你们做的另一件事是,让更多人参与到这个对话中,艺术家、诗人、作家让有人文学科背景的人们加入到讨论中。
因为我相信数据世界可以革新我们的生活。这和我们在资源产业、金融产业的尝试不同。让我们把人文元素带到故事中,我相信我们一定能带着它走向无限潜能的地方。
点这里关注我,记得标星哦~