Google 如何使用模式识别

Google 如何使用模式识别来了解图片内容

计算机“看”照片和视频的方式与人类不同。您在看某张照片的时候,看到的可能是好友正站在自家房前的这一画面。但对于计算机而言,这个画面只是一堆数据而已,这些数据可能会转译为形状以及色彩值信息。虽然计算机看到该照片时的反应无法与您一样,但经过训练后计算机可以识别某些色彩和形状模式。例如,计算机经过训练可识别组成面部数码影像的常见形状和色彩模式。这个过程称为人脸检测,这项技术可帮助 Google 保护您在街景视图等服务中的隐私权。在街景视图服务中,计算机会尝试检测街景视图采集车驶过时站在街上的所有人的脸部,然后对这些人脸进行模糊处理。同时正是借助此技术,Google+ 相册等服务能够在相应情况下建议您对可能出现人脸的照片或视频进行标记。人脸检测不会告诉您这是谁的脸,但它能帮您在照片中找出人脸。

如果想要更深入高级点,那么支持人脸检测的相同模式识别技术可帮助计算机了解所检测到的脸部特征。例如,某些模式可能会指明脸上蓄有胡须、戴着眼镜或其他类似特征。此类信息可用于帮助实现消除红眼等功能;还可让您在环聊时,通过在自己脸上相应位置添加胡子或单片眼镜为画面添加生动效果。

除人脸检测技术之外,Google 还在某些功能中采用了人脸识别技术。顾名思义,人脸识别可以帮助计算机将已知的人脸与新的人脸进行对比,以确定有没有匹配或相似之处。例如,“认出我”功能的用户也许希望能在上传的照片或视频中标记某些人并与他人分享,而人脸识别可帮助他们通过该功能找到一些线索。在 Google+ 帮助中心阅读有关“认出我”的详情

语音搜索的工作原理

利用语音搜索,您可以在设备上向 Google 搜索客户端应用提交语音查询,而无需手动输入查询内容。该功能利用模式识别将语音字词转录为书面文本。对于向语音搜索提交的每条语音查询,我们都会存储语言、国家/地区、语音样本以及系统对语音内容的猜测等信息。存储的音频数据不包括您的 Google 帐户 ID,除非您自己选择存储该信息。我们不会向 Google 发送任何语音样本,除非您自己主动使用语音搜索功能(例如,在快速搜索栏或虚拟键盘中按下麦克风图标,或在快速搜索栏显示已开启语音搜索功能时说出“Google”)。我们向 Google 服务器发送语音样本是为了识别出您的语音内容,而保留语音样本是为了改进我们的服务(包括对系统加以训练,以便更好地识别出正确的搜索查询)。