什么是机器学习?
2015-06-18 22:50:14 n此博文作者为John Platt,一位杰出的科学家,现在为微软工作。
大家好,我是John Platt。17年以来,我一直在微软做机器学习算法的研发和应用。这段时间机器学习开始流行起来,有很多人问我说,“到底什么叫机器学习?你能用它来干嘛?”
我很愿意解答这些疑问,因为事实上,在数量庞大的微软产品当中,微软的机器学习算是应用非常多的了,而正是这一点成就了微软成为一个有趣又很有影响力的厂家(这就像是糖果店对小孩子来说一样)。
总的来说,机器学习是将一串串数据转化为一个个软件,我们称它们为一个个“模型“,这些模型就代表着原来的数据集并且会整合数据以对接下来的新数据作出一些预测。因为机器学习应用如此广泛,我觉得可以对机器学习的应用做出一个笼统的分类。机器学习有这样三种应用:
1. 挖掘数据:机器学习可以帮助人们从庞大的数据中获得深入的理解。
2. 数据工程:机器学习可以帮助人们把数据转化成软件,从而对未知的数据做出一些判断。
3. 人工智能:机器学习可以模仿人的思维,可以发明出像人一样能够看见、听见、能够理解事物的计算机。
在微软,我们用机器学习来作上述所有的事。让我来分别举个例子:
应对恶意软件
微软恶意软件防御中心与微软调查小组合作,使用机器学习研发出一种新软件,可以自动监测恶意软件,还可以帮助分析员了解恶意软件的开发过程。如果感兴趣大家还可以在Dennis Batchelder的博客上了解更多。
建一个搜索引擎
微软旗下的“Bing"搜索引擎是一个复杂的系统,它能理解你的提问,搜索整个网站,然后得出能够帮到你的信息。因为“Bing”用户群极大,我们只有通过“自动决定程序”才能处理用户大量带有不确定性的且可能有歧义的日常语言。我们继续利用机器学习的技术去研发了“Bing”下面的一些小软件,与“Bing”一起构成一整个高效工作的搜索引擎。机器学习技术的一个重要搜索功能是排序功能:几年前,就是用我们研发的算法,微软调查小组的一队工作人员赢得了“学习如何排序”的比赛。
让计算机也能看见、能听见
微软一直在推动计算机视觉和语音识别领域的发展。在体感设备里有一种软件能识别你的手势,这种软件就是通过机器学习开发出来的。微软的语音识别系统是建立在计算机有能够深入学习的能力上的,我们从人脑结构中得到灵感研发了这种机器学习的模型。我们还用机器学习创造出了一种能够实时同声翻译的软件。
看到这些激动人心的应用程序,我意识到机器学习技术正给我们带来一个充满魔力的时代。有很多的研究者和开发者多年来都致力于这项技术的研发。基于摩尔定律和互联网,我们现在拥有足够的已分类的数据和计算方式去很好地利用机器学习技术来创造好的软件。我很期待能够与更多的研发者分享我们的算法和工具,从而让更多人可以运用他们的创造力去发明属于他们自己的计算机程序。
在我的下一篇文章里,我将说一说这二十年来微软如何一步一步开发出机器学习这门技术。我很期待能在我的博客里与大家交流。