转发:未来媒体访谈×袁晓如:大数据可视化——从用数据说话到让数据说话

   在万物互联的5G时代,媒体智能化已经成为不可阻挡的趋势和发展方向。人工智能技术与媒体如何融合?智能化会带来哪些媒体伦理问题?进入智能时代,媒体如何做好社会的“瞭望者”?新浪新闻、封面新闻联合推出《未来媒体访谈》节目智能媒体专题,探讨与智能媒体相关的问题。

访谈视频https://video.sina.com.cn/p/tech/2022-05-27/detail-imizirau5127037.d.html

本期嘉宾:袁晓如,北京大学智能学院研究员、长聘副教授,博士生导师;大数据分析与应用技术国家工程实验室常委副主任;机器感知与智能教育部重点实验室副主任。

  以下为访谈实录:

  主持人:Hello大家好,这里是由新浪新闻、封面新闻共同推出的未来媒体访谈节目,我们今天非常荣幸的邀请到北京大学智能学院研究员,博士生导师袁晓如教授。接我们有请袁教授来和我们聊一聊到底什么是数据可视化。

  袁晓如:如果大家去爱丁堡,有个苏格兰博物馆,博物馆前面有一个威廉·普莱费尔的塑像,他做的一个很重要的贡献是什么?他最初发明了现在我们经常用到的一些这样的图表,比如说一些曲线图,比如说一些饼图,其实大家今天如果你上网去搜索,你一找可视化,你可以看到它给你出来是各种各样的图,可视化简而言之一个就是我们把这个数据用一个图形的方式来去表示。比如说我们在农业的每亩的收成,或者说一些家庭的财产,或者说人口的多少,如果我们去看这里,我们同样的可以用数字来去描述,但是我们也可以用可视化来去描述,我们可以快速的去理解大量的数据里面有没有一些还特意的地方,或者说它整体的趋势。我们是可以并行的来去处理我们所有看到的解释,这是第一个。

  第二个大家注意到刚才这个例子里面,我们还马上能够注意到哪一些是明亮的红色,哪一些它有这些巨大的变化,这是我们的进化出来的人的这样的一个生理的机制,也让我们能够对某一些信号,我们能够引起特别的注意,我们就有更高的效率。

  主持人:追溯到早些年一直到现在,可视化经历了怎么样的一个发展历程?

  袁晓如:在计算机发育之前,我们看到像地图或者说也有一些这样的统计的图表,其实人们已经发明了很多,但是没有计算机的情况下,我们只能够手动把它绘制下来,它是一个静态的,而我们在最近的几十年我们有了计算机,我们用电脑来去驱动它背后的这些计算,我们就可以是什么?我不光是看到一个静态图,我还可以让它动起来。

  主持人:对于一个新鲜事物,我们通常都会有几个这样共性的问题,第一点它是什么?您刚刚已经帮我们解释过了,接下来我们会问它应用在哪里,就其实换句话来说,研究它对于我们来说有什么作用?

  袁晓如:实际上可视化的应用之处非常之广,当比较早期一点的,那是对于我们的全球的气候,我们可以有更多通过卫星来去获得各种各样气候的这些信息,我们就需要通过可视化来去理解它中间的这些变化,这个我们叫做科学可视化,然后到了90年代再往后的时候,人们发现我们其实还有更多的这些数据,比如说简单的来讲,我们的同学他一个学期他有多少门考试,最后考试这些分数,实际上每一门考试它都是形成一个维度,这样的一些数据,人们要来去理解它,除了我们把它列在这样的表格上之外,我们还需要一个更好的方式产生出另外一个分支,叫做信息可视化。

  像这几年我们有一个很重要的词就是数据新闻。数据新闻里面必不可少,其实用可视化来去表现数据新闻里面的数据,比如说我们来去看像我们的疫情相当多的媒体用可视化来去表现, 再往后还有一个更加先进一点的这样的可视化的发展的过程,我们来给它起个名字叫做可视分析,让人和机器结合起来,去做一些关键的决策,机器去做它的一些计算,然后再传递给人,我们通过可视化作业界面,我们再进一步去扩展更多的信息。

 

  主持人:通过您的描述,我能不能这么理解,就是信息可视化是可以把一切的资料做成饼状图、柱状图,各种地图或者色块呢?

  袁晓如:应该来讲是这样,如果说这一些数据它我们有分析的需要,然后我们根据我们这些需要,我们可以来去设计一些相应的形式,但这个形式不一定是我们经常见到的。

  主持人:那也就是说不光像这些,您刚才提到这些有形的东西,比如说气象交通这些东西也可以用可视化来表达吗?

  袁晓如:实际上我们从数据的观点来讲唉这些数据和其他的我们看到一些有形的物品,它并没有本质的区别,我们把它叫做高位数据,或者说很多商业上的报表都是属于这一类。

  还有一类我们关心的是什么?它人际之间的关系,现在我们看到人花越来越多的时间放在我们的网络世界里虚拟世界里,比方说我们花很多的时间来去看微信,我们在微信上可能跟很多人来去接触,这方面这些数据我们同样的可以来去对它进行可视化,并且能够让你看到这些无形的东西。

  主持人:您这么一说我就懂了,我想问问这种无形的,比如说网络上的这种人的情绪也是可以被可视化的吗?

  袁晓如:实际上都可以,这里面有一个觉得挺合适的例子,因为您这边也是来自于新浪新闻,在其实差不多10年前,我们就开始来去对微博上面的一些信息来去对它进行相应的可视化。

  最早的一个可视化,我们来去看微博上面大家都来去做各种各样的转发,我们把它转化成这样的地图。

  还有在微博上,大家有时候在不同的地方发一个签到,这个是我们也可以把大家签到的这些信息,我们把它投影在这个空间里我们,就可以看到大家一个活动的这样一个这个地图里面,在这里面我们通过去可视化微博数据的不同的侧面,这个可以做什么?比如说像有一些厂商他要在微博上面,他要去投放一些 PR,投放一些相应的广告或者一些活动,我们可以通过这样的可视化去了解他的信息怎样被转发的。

  再有另外一个也有很多做媒体研究的,12年在北京有一次这个是暴雨,暴雨的时候,其实北京很多地方都有积水,我们当时把微博上面的这些提到积雪的这些微博把它取出来,然后我们把它的位置定位在我们这样一个地图上。

  而且后面也有来去做历史地理研究的人,大家看了地图,我们如果回过去看,几百年前,那个时候跟现在的城市建设很多不一样,但是今天积水的地方都是那时候的一些湿地,所以我们可以看到这相互之间它是有相互印证,所以我们通过这样的可视化,我们就能够更容易的去看到一个事物的全局。

  主持人:那么既然提到了社交媒体的可视化,它除了可以展示用户的一个特点和特长喜好等等,还有您刚刚提到的可以整合信息,帮助大家了解事物的起因,它还有什么其他的作用吗?

  袁晓如:这个方面就很多了,像我们最近做个一个比较有趣的事情,我们来去可视化一些这种视频上面大家的弹幕,但弹幕你看很多人在上面画画饭弹幕,但是我们通过可视化能够看到什么,比如说我这个视频来拍的,是不是我有改进的这个地方,或者说我们可以看到在这上面一些社会的大家共同的有趣的想法,或者说我们反映出来的大家讨论的一些热议的话题等等之类,这些都是可以来进一步来去进行探索的。

  主持人:我们刚刚聊的都是一些社交有关的话题,那么我相信大家还有其他更关注的问题,比如说衣食住行、医疗、养老这种很基础的民生的问题,那么可视化的应用又和我们的生活有什么样的关联呢?

  袁晓如:这个方面其实很多的,比如说像交通。比如说像我们在13年左右,我们做了一个工作,我们去把这些出租车的信息聚合起来然后我们从中间提出信息,我们可以去可视化一个交通一个路口,它的拥堵怎么样开始,它又怎么样演化,怎么样逐步的它会去扩散。

  再像有一些比如说在空中这些飞机它飞行的轨迹,我们可以把它聚合起来,可以帮助空管的人员更好的去了解相应的效率,然后来去提出相应的管制的这个措施。

  比如说在医院里面,我们看到每个病人他的病例有一些比较复杂的可能病例很长,但医生要花很长的时间来去做相应的调查,研究我们可以通过可视化方式让医生更好的去理解相应的可视化。  

  还有一个我们正在开展的研究,这上面我们希望通过可视化把相应的一些信息能够更好去传递给病人。

  主持人:智能交互和可视化的一个协同发展,是这样的吗?

  袁晓如:可视化可以来讲,它是逐步的越来越走向智能,比如说像这里面我们做的一个比较有趣的可视化的方式就是说我们打开一张这样的一个表格,然后我们可以对他进行提问,我们来去提一些问题的时候,背后它就可以通过一些智能的计算来去理解你的问题是什么,但这个时候它不是说只告诉你一些文字,直接告诉你一个数字的答案,而是我能够通过一个可视化来去表达他的最后的结果,而且甚至说我可以让他根据用户的需求,我来去改变这些可视化形式。

  主持人:我们都知道任何事物的研发都会有它的两面性,新技术的产生会改变世界,但是同时又会有很多不同的问题发生,那么您觉得可视化带给我们的负面影响有哪些?

  袁晓如:这个的话实际上我们就想可视化本身它是一个中性的,当然就要看你怎么来去使用它。如果我们使用了的好,它可以大大的加速我们的信息沟通的过程,降低相应我们这些沟通的成本,

  可是话它又是一个非常有力的传递信息的工具,所以也有可能他有一些被误用的地方,如果我们使用不适当,可能会造成观察者他的一些误解。

  就像我们使用颜色一样,对有的颜色就像绿色红色,哪个是上升哪个是下降,实际上在不同的国度里面,它有一些约定书证的东西,所以这是一个非常复杂的现象。

  主持人:年底的时候很多APP都推出了可视化,一年回顾很多,比如说你这一年听了什么歌,您这一年的消费统计甚至是这一年的行程记录,那么在大数据的时代如何来保障用户的个人隐私数据?

  袁晓如:可视化呢本身它能够作为一个手段,就是说我推送给最终的用户的时候,我可以把相应的一些细节给它隐藏掉,所以这是一个比较合适的方法。

  另外一个对于相应的隐私来讲,其实是隐私是相对的,比如说我们很熟悉的时候,可能你的年龄生日这些就不是什么隐私,但是说我对一个陌生人来说,我可能不一定愿意告诉他来相应的这些信息。这个时候也是我要针对相应的这些不同的,用户,他要有相应的这些授权,这些相应的隐私来说可能重要的这样一些机构,而他使用这些可视化,我们也会考虑将相应的一些授权等等之类。我们可以有一个更好的来去保护我们的每一个终端用户,这样的过程。

  主持人:可视化在技术上有没有什么面临的一些挑战问题?

  袁晓如:实际上可视化还在不断的进行进化和发展,也就是说可视化它不是说简单的一个算法,它更多的是跟人的认知相关联的,所以从研究上来说,我们需要去理解这方面关系。

  另外一个虽然现在有很多可视化的方法,但是对于一些复杂的这些可视化的方法,或者说对于这些方法有效性,其实我们还没有对它进行一个全面深入的理解,这是第二个。

  再一个我们像现在面临着很巨大的数据复杂数据怎么样来去针对这样一个多变的场景下,我们设计相应的可视化也是面临很多机会和挑战。

  主持人:我们刚才聊到的是这些可视化的发展历程,我不知道现在是一个AA高速发展的时代,基于这个前提,可是技术将会如何的进行下一步的变化。

  袁晓如:现在我们来去使用可视化,面临一个非常巨大的成本问题或者挑战问题,也就是说在整个社会里面可能大家都能够用到可视化,但是能够去实现制作这样可视化的人其实并不多的,所以怎么样能够高效的去实现这样可视化的方法,怎么样能够真正的降低成本,我可以写几段简单的这样的一个表述形式,它是没有经过编程训练的人,他可能学了半个小时,他也能够写一些有效的可视化的方法,还有我可以有一些比较便捷的,比如说我看到一个已有的可视化形式,或者说我们做了一个静态的可视化,我可以直接去施加一些上面的一些插件,让它能够互动起来,能够动起来,像这样的这个方式是将会越来越多的去满足我们日益增长的这样的需要。

  主持人:现在可视化数据分析正在成为一个主流,您帮我们设想一下下一代的数据分析将会如何发展?

  袁晓如:实际上下一代来讲,它应该更好的来去理解我们人类的需求。

  再有一个我们可以看到怎么样沉浸在我们的一个世界里面,怎么样把可视化跟我们现实世界更好的去融合,应用在更广泛的场景里面,就像我们最近来做的这样的一个中国古代的迁居的地图,它可以把古代一些名人他的籍贯和他去哪里来去做官来去做事。他们之间的迁移的过程,我们交互式的呈现在这样一个地图里头,我们可以去看看宋朝和明朝和清朝,那中国的各个省份它的变化是多少?

  我们可以来去看我们的历史,来看我们的文学,比如说我们可以可视化三国演义、可视化红楼梦等等之类,还有一个我们也可以去可视化我们自己每天的生活。其实我们可以看到在这里面更好的来去记住我们相应的过去,然后我们更好的来去看我们的未来。

栏目制片人:智惠群

本期嘉宾:北京大学智能学院研究员 博士生导师 袁晓如

责任编辑:田甜雨

信息来源:新浪新闻、未来媒体访谈、新浪视频

“数字开放 元信宇宙”学术报告会暨SZCCF 2021年会
年会议程(初定): 技术分论坛 + 院士报告 + 颁奖仪式 + 晚宴 + 企业展示区 + 招聘会;
年会地点: 深圳技术大学(大数据与互联网学院)
活动时间(预计): 6月下(周六)
现就年会活动向广大关注学会工作的朋友们征集活动意见,大家可以积极向我们建言献策。