加入VIP
美团机器学习实践

美团机器学习实践

作者
美团算法团队
出版社
人民邮电出版社
页数
323
格式
pdf
语言
中文

本书是一本关于机器学习和数据挖掘在真实的业务场景如何落地、如何发挥作用的书。它是美团的算法工程师们利用工作之余的时间,集体创作完成的。作者来自美团公司的各个部门,既包括负责用户画像、文本图像理解这样偏基础的研发部门,也包括广告、搜索以及推荐这样的产品研发团队。本书的写作内容和过程也充分体现了美团工程师团队的气质——踏实务实,同时又热爱学习和分享。

机器学习以及数据挖掘相关技术如今在美团公司内的几乎所有环节和场景都有应用,从直接关系到用户体验的搜索和推荐,再到提高配送人员效率的智能配送和调度算法,以及商家端的广告系统和智能选址等服务,甚至App的bug分类,这些你能想到或者不能想到的机器学习乃至人工智能相关技术都发挥了巨大的价值。当然,我们做的这些工作还远远不够,越是在O20领域持续工作,我们越能感受到人工智能技术可能给这个行业带来的巨大改变和广阔前景。机器学习、运筹调度、IOT、AR、语音以及视觉感知等所有这些方向,都还有巨大的技术挑战和应用空间等着我们去突破,从而让人们“吃得更好,活得更好”。

和传统的机器学习相关的理论教科书相比,本书侧重于这些理论如何在真实的业务场景落地,所使用的都是美团公司内的真实案例。这也是我们编写本书的初衷。我们注意到在这个人工智能技术成为中国的国家战略的时代,有很多卓越的国内外学者贡献了大量的机器学习和人工智能的理论书籍,但作为第四代工业革命浪潮的代表技术,其在各行各业内的具体应用案例和工程实践也同样重要,而这方面的书籍是相对较少的。希望我们在这本书中的分享能够起到抛砖引玉的作用,同时也能在这方面给广大读者带来一定的收获。

最后,也非常欢迎对本书有任何建议或者意见的读者,联系美团技术团队。机器学习以及人工智能技术,一方面理论还在飞速发展,另一方面新的应用也层出不穷。作为这方面从业者的我们,尤其希望和大家产生交流和碰撞。我们深信,交流和碰撞是促使我们进步的动力。

美团作为国内O2O领域领先的服务平台,结合自身的业务场景和数据,积极进行了人工智能领域的应用探索。在美团的搜索、推荐、计算广告、风控、图像处理等领域,相关的人工智能技术得到广泛的应用,并取得了不错的效果。我们组建了算法技术通道,并制定了相关的课程体系和分享机制。经过多年的努力,美团在人工智能和O20的结合上,积累了丰富的经验。写作本书的目的之一就是与业界分享这些经验,共同推进AI+O20的发展。

本书分为6大部分,全面介绍了美团在多个重要方面对机器学习的应用。

第一部分是通用流程,包括第1~4章。这里讲述了机器学习解决实际问题的通用流程:如何分析问题,如何进行特征工程、常见模型的比较和选择,以及如何进行效果评测;最后还介绍了在各类机器学习竞赛中常用的模型融合技巧。

第二部分是数据挖掘,包括第5~7章。用户画像在业务上有着重要的作用,是个性化推荐排序的基础。曾经出现网上流传的百度内部截图、搜狗上市新闻为什么没有推荐给CEO的情况,解决这类问题的关键在于用户画像技术。这里详细介绍了美团在这方面的实践。实体链接是知识图谱和POI数据建设的重要基础,评论挖掘是UGC内容挖掘的常见应用,这里也介绍了我们关于UGC内容挖掘的做法。

第三部分是搜索和推荐,包括第8~10章。不同于全网网页搜索、垂直搜索和商品搜索。O2O领域的搜索排序有着自身的特点,面临的挑战也存在差异。本部分分享了关于搜索排序中常见的查询分析、用户意图识别、机器学习排序的做法和实践。推荐在O2O场景下有着非常关键的作用,最后对推荐部分也作了介绍。

第四部分是计算广告,包括第11章和第12章。计算广告是互联网目前主流的盈利模式之一,这里从广告设计的机制特点、定向方式、用户偏好、损失建模等方面,详细地介绍我们在这个领域的实践。

第五部分是深度学习,包括第13~15章。这里介绍了美团在计算机视觉和自然处理领域的深度学习实践。深度学习在业务上的应用非常多,限于篇幅,我们主要分享了在图像分类、OCR识别、图像质量优化、情感分析、机器学习排序方面的应用。

第六部分是算法工程,包括第16章和第17章。机器学习算法要在实际应用中更好地落地,相关的工程也非常重要。这里我们主要介绍了在大规模机器学习、特征的生产和监控模型线上效果实验和评测等方面的工作。

本书并不是一本机器学习的理论教材,它的内容非常广泛,主要侧重工业界的业务实践。本书非常适合有一定机器学习基础的工程技术人员和在校大学生学习和阅读。通过阅读本书,有经验的算法工程师可以了解美团在这方面的做法,在校大学生可以学习机器学习算法如何在具体的业务场景中落地。

评分及评论

暂无评分

来评个分数吧

  • 5分
    0
  • 4分
    0
  • 3分
    0
  • 2分
    0
  • 1分
    0
美团机器学习实践
免费资源
立即下载