AI 收藏夹 Vol.001:当你的语音助手再也不温顺

2021年11月22日 阅读数:4
这篇文章主要向大家介绍AI 收藏夹 Vol.001:当你的语音助手再也不温顺,主要内容包括基础应用、实用技巧、原理机制等方面,希望对大家有所帮助。

人工智能是一门融合了计算机科学、图形学、生物学、语言学等学科的前沿科学。随着电子硬件的发展和算力的提高,人工智能的技术理论逐渐走向落地,各类应用和设想层出不穷,丰富了其内涵和外延。git


「AI 收藏夹」将会与你们分享一些 AI 领域实用和有趣的文章和工具,与你们一块儿见证技术的创新与变革。github


文章web

0 1数据库

用卷积神经网络(CNNs)鉴定油画


2017 年 11 月 15 日,一幅耶稣的肖像在纽约以 4.503 亿美圆的价格成交,这是迄今为止最昂贵的易手画做。然而,不少专家对这幅画的真伪提出质疑,指出画做通过修复,或非本人所作。

肯定一件艺术品是不是真迹,须要对艺术家的风格和技巧进行精微的判断,这项任务很适合交给卷积神经网络(CNNs)。上 图就是将神经网络应用于伦勃朗的画中。暖色部分表示,机器学习画师做品后判断该部分画做更有多是真迹[1]。 

在医学方面,巨大的组织学样本全幻灯片图像可能有数十亿像素大小,其中的细节信息一样很是丰富。科学家们正在尝试使用卷积神经网络自动化分析病理图像,捕获肿瘤细胞的表征。


0 2微信

在将来
还会有「婚礼摄像师」这个职业吗?


这篇文章[2]提出了一个设想:咱们能够用 AI 自动处理视频剪辑。

让咱们想象一下这个场景:婚礼上,亲朋好友们用手机录下现场的精彩瞬间,他们在同一个 App 里进行实时协做,AI 会自动根据光线、机位、声音效果检测每一段视频的质量,并自动剪辑其中精彩的段落。当新人接吻时,AI 还会识别到须要特写的场景,给手机一个反馈,触发手机拉近特写。这种多机位拍摄、多人协做的摄影模式,让摄影成为一种社交体验。你会期待这种「摄影社交」吗?


0 3网络

李逵变李鬼?
AI 改变视频制做范式


想象一下,你输入几行文字,一个明星就会在几秒钟内说出这些话。

计算机图形学家 Maneesh Agrawala 建立了一个视频编辑软件,只要有充足的原始视频,他就能让任何一我的说出他们没有说过的话。这些视频很是逼真,被称为「深度伪造」(Deepfake)。有了这项技术,电视和电影能够避免昂贵的重拍,声带受损的人能够用这项技术恢复他们天然的声音[3]……不过,关于「深度伪造」的伦理边界在哪里?这也是值得咱们思考的问题。


0 4app

用 AI 预测事故热点


经过分析过去四年的路况数据,AI 分析并预测出多个事故高风险区域(如右侧中部的圆点所示),而实际上这些地方暂未出现过事故。随后几年,这些地方真的出车祸了。

这篇论文名为《基于卫星图像和 GPS 轨迹的高分辨率交通事故风险地图推断》[4]。做者使用 AI 分析大量的卫星地图、 GPS 轨迹、道路地图和历史事故,生成了一张高分辨率的事故风险地图。


0 5机器学习

Feminist 机器人挑战咱们的性别偏见


你有没有注意到,语音助手的声音默认都是女声?面对羞辱,语音助手能够反击和显得「不温顺」吗?

在这篇文章[5]中,做者作了一个儿童实验:女性语音助手将会反击那些含有性别歧视的语言。人机交互或许有可能纠正性别偏见、影响人的行为,而这个实验自己也正表明了一种立场。


工具

0 1ide

DeepFaceLive 实时换脸


🌟 功能: 
  • 对输入的摄像头视频流或本地视频文件进行实时换脸工具


👀 亮点:
  • 五官无违和感

  • 不一样性别也能够替换

  • DeepFaceLab 中已有训练好的模型可以使用


👉 地址:
https://github.com/iperov/DeepFaceLive


0 2

lxi.ai 让你的网页书签拥有「神经网络」


🌟 功能:
  • 根据网页内容的不一样,为书签页自动打上标签

  • 根据标签,生成「神经网络」,标明关联性


👀 亮点:
  • 经过 Chrome 插件收集和管理网页书签,方便

  • 重合度较高的书签将会自动关联,造成复杂的网络


👉 地址: https://lxi.ai/


0 3

用 AI 让老照片焕发新生


🌟 功能:
  • 修复划痕

  • 色彩加强

  • 面部加强


👀 亮点:
  • 友好的图形用户界面


👉 地址: https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life


参考资料:

[1] 卷积神经网络鉴定油画:https://spectrum.ieee.org/this-ai-can-spot-an-art-forgery
[2] AI 自动剪辑视频:https://spectrum.ieee.org/ai-video-editing
[3] 「深度伪造」视频:https://hai.stanford.edu/news/how-ai-changing-video-editing
[4] AI 预测事故热点:https://openaccess.thecvf.com/content/ICCV2021/papers/He_Inferring_High-Resolution_Traffic_Accident_Risk_Maps_Based_on_Satellite_Imagery_ICCV_2021_paper.pdf
[5] 语音机器人挑战性别偏见:https://spectrum.ieee.org/human-robot-interaction




Zilliz 以从新定义数据科学为愿景,致力于打造一家全球领先的开源技术创新公司,并经过开源和云原生解决方案为企业解锁非结构化数据的隐藏价值。
Zilliz 构建了 Milvus 向量数据库,以加快下一代数据平台的发展。Milvus 数据库是 LF AI & Data 基金会的毕业项目,可以管理大量非结构化数据集,在新药发现、推荐系统、聊天机器人等方面具备普遍的应 用。
解锁更多应用场景

本文分享自微信公众号 - ZILLIZ(Zilliztech)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。