又搞事情:谷歌开源数据可视化管理器Embedding Projector

今日早些时间,谷歌宣布对其数据可视化工具Embedding Projector进行开源。此前,这项工具用来帮助机器学习研究者在不需要安装和运行TensorFlow的情形下进行数据可视化。

零镜网也在日前对数据可视化专门撰文进行了阐述。我们生活在三维世界,能够感知事物的长度、宽度和高度,但我们难以想象四维、五维、六维的世界是什么样子的。这也是为什么大多数人看到克里斯托弗·诺兰的代表作《星际救援》时觉得增加的维度是荒谬的。

main-qimg-5f48d8daf87ff55bd5d230b42939cc7c

代替思考这些维度,你可以尽量尝试思考数据。当你对两所房子进行区分时,你会从以下角度进行比较:颜色、尺寸、屋顶样式、院子形状。这个模型就能够被考虑认作为四维度的模型。

你通常采取在PPT中创建图表的方式来展现对比区别,并且你也能做到。但是当你面对成千上万的数据时,你会发现传统的数据处理开始败下阵来。这就是Embedding Projector的用武之地了。

embedding-mnist

我们可以举个简单例子来进行说明:当你使用像网易云音乐这样的app时,它会在第二天根据你此前喜欢的歌曲向你推荐歌曲,整合出来的歌单是针对你的个人偏好生成的精确、个性化的歌曲建议。在这个过程中使用了机器学习,通过数据收集能够建立起多个维度的可视化图并进行分析。而这在PPT中显然无法做到。

此前我们的文章中介绍过,在VR中,数据可视化会变得更为容易。你能够站在数据面前对其进行任意方向的改变,它能够让你再也不用对多维数据和高密度数据感到惊慌,使你安然面对各种复杂的数学数据。