正文

人工智能十大经典算法（人工智能十大经典算法是什么）

发布时间：2023-03-13 22:49:27 稿源：创意岭阅读： 123 问大家

大家好！今天让创意岭的小编来大家介绍下关于人工智能十大经典算法的问题，以下是小编对此问题的归纳整理，让我们一起来看看吧。

ChatGPT国内免费在线使用，一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等

只需要输入关键词，就能返回你想要的内容，越精准，写出的就越详细，有微信小程序端、在线网页版、PC客户端

官网：https://ai.de1919.com

本文目录:

1、人工智能方面有哪些算法
2、数据挖掘相关课程
3、游戏开发中会用到哪些常用AI算法
4、生活中的人工智能之搜索和推荐算法

人工智能十大经典算法（人工智能十大经典算法是什么）

一、人工智能方面有哪些算法

模式识别需要非常好的概率论，数理统计；另外会用到少量矩阵代数，随机过程和高数中的一些运算，当然是比较基础的；如果要深入的话恐怕需要学泛函，但是一般情况下不需要达到这种深度。神经网络，遗传算法等智能算法在模式识别有非常重要的应用，但是一般不需要学习计算机学科的人工智能，我们控制有一个交叉学科叫做智能控制是讲这些的，智能控制不需要什么基础，有中学数学的集合和对空间有一点点的了解就足够了，模糊数学的基础是包含在这门学科里的。

二、数据挖掘相关课程

Ⅰ 数据挖掘与数据分析是学什么的

数据挖掘（英语：Data mining），又译为资料探勘、数据采矿。它是数据库知识发现（英语：Knowledge-Discovery in Databases，简称：KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关，并通过统计、在线分析处理、情报检索、机器学习、专家系统（依靠过去的经验法则）和模式识别等诸多方法来实现上述目标。

数据挖掘学习的主要方向在于，挖掘的算法，使用什么算法能够得到最好的结果。

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法：C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析，提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中，数据分析可帮助人们作出判断，以便采取适当行动。

数据分析的工具：

Excel作为常用的分析工具，可以实现基本的分析工作，在商业智能领域Cognos、Style Intelligence、Microstrategy、Brio、BO和Oracle以及国内产品如Yonghong Z-Suite BI套件等。

非要说数据挖掘和分析的区别可分为以下几点：

1、“数据分析”的重点是观察数据，而“数据挖掘”的重点是从数据中发现“知识规则”KDD（Knowledge Discover in Database）；

2、“数据分析”得出的结论是人的智能活动结果，而“数据挖掘”得出的结论是机器从学习集（或训练集、样本集）发现的知识规则；

3、“数据分析”得出结论的运用是人的智力活动，而“数据挖掘”发现的知识规则，可以直接应用到预测。

4、“数据分析”不能建立数学模型，需要人工建模，而“数据挖掘”直接完成了数学建模。如传统的控制论建模的本质就是描述输入变量与输出变量之间的函数关系，“数据挖掘”可以通过机器学习自动建立输入与输出的函数关系，根据KDD得出的“规则”，给定一组输入参数，就可以得出一组输出量。

Ⅱ 请问你是数据挖掘的研究生数据挖掘研究生阶段都学什么

数据挖掘(Data Mining)就是从大量数据中发现潜在规律、提取有用知识的方法和技术。因为与数据库密切相关，又称为数据库知识发现(Knowledge Discovery in Databases，KDD) ，就是将高级智能计算技术应用于大量数据中，让计算机在有人或无人指导的情况下从海量数据中发现潜在的，有用的模式(也叫知识)。

广义上说，任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来，数据挖掘就是BI（商业智能）。但从技术术语上说，数据挖掘(Data Mining)特指的是：源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的提炼，最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上，我们可以定义：数据挖掘是从特定形式的数据集中提炼知识的过程。数据挖掘往往针对特定的数据、特定的问题，选择一种或者多种挖掘算法，找到数据下面隐藏的规律，这些规律往往被用来预测、支持决策。

数据挖掘的主要功能

1．分类：按照分析对象的属性、特征，建立不同的组类来描述事物。例如：银行部门根据以前的数据将客户分成了不同的类别，现在就可以根据这些来区分新申请贷款的客户，以采取相应的贷款方案。

2．聚类：识别出分析对内在的规则，按照这些规则把对象分成若干类。例如：将申请人分为高度风险申请者，中度风险申请者，低度风险申请者。

3．关联规则和序列模式的发现：关联是某种事物发生时其他事物会发生的这样一种联系。例如：每天购买啤酒的人也有可能购买香烟，比重有多大，可以通过关联的支持度和可信度来描述。与关联不同，序列是一种纵向的联系。例如：今天银行调整利率，明天股市的变化。

4．预测：把握分析对象发展的规律，对未来的趋势做出预见。例如：对未来经济发展的判断。

5．偏差的检测：对分析对象的少数的、极端的特例的描述，揭示内在的原因。例如：在银行的100万笔交易中有500例的欺诈行为，银行为了稳健经营，就要发现这500例的内在因素，减小以后经营的风险。

需要注意的是：数据挖掘的各项功能不是独立存在的，在数据挖掘中互相联系，发挥作用。

数据挖掘的方法及工具

作为一门处理数据的新兴技术，数据挖掘有许多的新特征。首先，数据挖掘面对的是海量的数据，这也是数据挖掘产生的原因。其次，数据可能是不完全的、有噪声的、随机的，有复杂的数据结构，维数大。最后，数据挖掘是许多学科的交叉，运用了统计学，计算机，数学等学科的技术。以下是常见和应用最广泛的算法和模型：

(1) 传统统计方法：① 抽样技术：我们面对的是大量的数据，对所有的数据进行分析是不可能的也是没有必要的，就要在理论的指导下进行合理的抽样。② 多元统计分析：因子分析，聚类分析等。③ 统计预测方法，如回归分析，时间序列分析等。

(2) 可视化技术：用图表等方式把数据特征用直观地表述出来，如直方图等，这其中运用的许多描述统计的方法。可视化技术面对的一个难题是高维数据的可视化。

职业能力要求

基本能力要求

数据挖掘人员需具备以下基本条件，才可以完成数据挖掘项目中的相关任务。

一、专业技能

硕士以上学历，数据挖掘、统计学、数据库相关专业，熟练掌握关系数据库技术，具有数据库系统开发经验

熟练掌握常用的数据挖掘算法

具备数理统计理论基础，并熟悉常用的统计工具软件

二、行业知识

具有相关的行业知识，或者能够很快熟悉相关的行业知识

三、合作精神

具有良好的团队合作精神，能够主动和项目中其他成员紧密合作

四、客户关系能力

具有良好的客户沟通能力，能够明确阐述数据挖掘项目的重点和难点，善于调整客户对数据挖掘的误解和过高期望

具有良好的知识转移能力，能够尽快地让模型维护人员了解并掌握数据挖掘方法论及建模实施能力

进阶能力要求

数据挖掘人员具备如下条件，可以提高数据挖掘项目的实施效率，缩短项目周期。

具有数据仓库项目实施经验，熟悉数据仓库技术及方法论

熟练掌握SQL语言，包括复杂查询、性能调优

熟练掌握ETL开发工具和技术

熟练掌握Microsoft Office软件，包括Excel和PowerPoint中的各种统计图形技术

善于将挖掘结果和客户的业务管理相结合，根据数据挖掘的成果向客户提供有价值的可行性操作方案

应用及就业领域

当前数据挖掘应用主要集中在电信(客户分析)，零售(销售预测)，农业(行业数据预测)，网络日志(网页定制)，银行(客户欺诈),电力(客户呼叫)，生物(基因)，天体(星体分类)，化工，医药等方面。当前它能解决的问题典型在于：数据库营销(Database Marketing)、客户群体划分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉销售(Cross-selling)等市场分析行为，以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等等，在许多领域得到了成功的应用。如果你访问著名的亚马逊网上书店(amazon)，会发现当你选中一本书后，会出现相关的推荐数目“Customers who bought this book also bought”，这背后就是数据挖掘技术在发挥作用。

数据挖掘的对象是某一专业领域中积累的数据；挖掘过程是一个人机交互、多次反复的过程；挖掘的结果要应用于该专业。因此数据挖掘的整个过程都离不开应用领域的专业知识。“Business First, technique second”是数据挖掘的特点。因此学习数据挖掘不意味着丢弃原有专业知识和经验。相反，有其它行业背景是从事数据挖掘的一大优势。如有销售，财务，机械，制造，call center等工作经验的,通过学习数据挖掘，可以提升个人职业层次，在不改变原专业的情况下，从原来的事务型角色向分析型角色转变。从80年代末的初露头角到90年代末的广泛应用，以数据挖掘为核心的商业智能(BI)已经成为IT及其它行业中的一个新宠。

数据采集分析专员

职位介绍：数据采集分析专员的主要职责是把公司运营的数据收集起来，再从中挖掘出规律性的信息来指导公司的战略方向。这个职位常被忽略，但相当重要。由于数据库技术最先出现于计算机领域，同时计算机数据库具有海量存储、查找迅速、分析半自动化等特点，数据采集分析专员最先出现于计算机行业，后来随着计算机应用的普及扩展到了各个行业。该职位一般提供给懂数据库应用和具有一定统计分析能力的人。有计算机特长的统计专业人员，或学过数据挖掘的计算机专业人员都可以胜任此工作，不过最好能够对所在行业的市场情况具有一定的了解。

求职建议：由于很多公司追求短期利益而不注重长期战略的现状，目前国内很多企业对此职位的重视程度不够。但大型公司、外企对此职位的重视程度较高，随着时间的推移该职位会有升温的趋势。另外，数据采集分析专员很容易获得行业经验，他们在分析过程中能够很轻易地把握该行业的市场情况、客户习惯、渠道分布等关键情况，因此如果想在某行创业，从数据采集分析专员干起是一个不错的选择。

市场/数据分析师

1. 市场数据分析是现代市场营销科学必不可少的关键环节: Marketing/Data Analyst从业最多的行业: Direct Marketing (直接面向客户的市场营销) 吧，自90年代以来, Direct Marketing越来越成为公司推销其产品的主要手段。根据加拿大市场营销组织(Canadian Marketing Association)的统计数据: 仅1999年一年 Direct Marketing就创造了470000 个工作机会。从1999至2000，工作职位又增加了30000个。为什么Direct Marketing需要这么多Analyst呢? 举个例子, 随着商业竞争日益加剧，公司希望能最大限度的从广告中得到销售回报, 他们希望能有更多的用户来响应他们的广告。所以他们就必需要在投放广告之前做大量的市场分析工作。例如，根据自己的产品结合目标市场顾客的家庭收入，教育背景和消费趋向分析出哪些地区的住户或居民最有可能响应公司的销售广告，购买自己的产品或成为客户，从而广告只针对这些特定的客户群。这样有的放矢的筛选广告的投放市场既节省开销又提高了销售回报率。但是所有的这些分析都是基于数据库，通过数据处理，挖掘，建模得出的，其间，市场分析师的工作是必不可少的。

2. 行业适应性强: 几乎所有的行业都会应用到数据, 所以作为一名数据/市场分析师不仅仅可以在华人传统的IT行业就业，也可以在 *** ，银行，零售，医药业，制造业和交通传输等领域服务。

现状与前景

数据挖掘是适应信息社会从海量的数据库中提取信息的需要而产生的新学科。它是统计学、机器学习、数据库、模式识别、人工智能等学科的交叉。在中国各重点院校中都已经开了数据挖掘的课程或研究课题。比较著名的有中科院计算所、复旦大学、清华大学等。另外， *** 机构和大型企业也开始重视这个领域。

据IDC对欧洲和北美62家采用了商务智能技术的企业的调查分析发现，这些企业的3年平均投资回报率为401%，其中25%的企业的投资回报率超过600%。调查结果还显示，一个企业要想在复杂的环境中获得成功，高层管理者必须能够控制极其复杂的商业结构，若没有详实的事实和数据支持，是很难办到的。因此，随着数据挖掘技术的不断改进和日益成熟，它必将被更多的用户采用，使更多的管理者得到更多的商务智能。

根据IDC(International Data Corporation)预测说2004年估计BI行业市场在140亿美元。现在，随着我国加入WTO，我国在许多领域，如金融、保险等领域将逐步对外开放，这就意味着许多企业将面临来自国际大型跨国公司的巨大竞争压力。国外发达国家各种企业采用商务智能的水平已经远远超过了我国。美国Palo Alto 管理集团公司1999年对欧洲、北美和日本375家大中型企业的商务智能技术的采用情况进行了调查。结果显示，在金融领域，商务智能技术的应用水平已经达到或接近70%，在营销领域也达到50%，并且在未来的3年中，各个应用领域对该技术的采纳水平都将提高约50%。

现在，许多企业都把数据看成宝贵的财富，纷纷利用商务智能发现其中隐藏的信息，借此获得巨额的回报。国内暂时还没有官方关于数据挖掘行业本身的市场统计分析报告，但是国内数据挖掘在各个行业都有一定的研究。据国外专家预测，在今后的5—10年内，随着数据量的日益积累以及计算机的广泛应用，数据挖掘将在中国形成一个产业。

众所周知，IT就业市场竞争已经相当激烈，而数据处理的核心技术---数据挖掘更是得到了前所未有的重视。数据挖掘和商业智能技术位于整个企业IT-业务构架的金字塔塔尖，目前国内数据挖掘专业的人才培养体系尚不健全，人才市场上精通数据挖掘技术、商业智能的供应量极小，而另一方面企业、 *** 机构和和科研单位对此类人才的潜在需求量极大，供需缺口极大。如果能将数据挖掘技术与个人已有专业知识相结合，您必将开辟职业生涯的新天地！

职业薪酬

就目前来看，和大多IT业的职位一样，数据仓库和数据挖掘方面的人才在国内的需求工作也是低端饱和，高端紧缺，在二线成熟，高端数据仓库和数据挖掘方面的人才尤其稀少。高端数据仓库和数据挖掘人才需要熟悉多个行业，至少有3年以上大型DWH和BI经验，英语读写流利，具有项目推动能力，这样的人才年薪能达到20万以上。

职业认证

1、SAS认证的应用行业及职业前景

SAS全球专业认证是国际上公认的数据挖掘和商业智能领域的权威认证，随着我国IT环境和应用的日渐成熟，以上两个领域将有极大的行业发展空间。获取SAS全球专业认证，为您在数据挖掘、分析方法论领域积累丰富经验奠定良好的基础，帮助您开辟职业发展的新天地。

2、SAS认证的有效期

目前SAS五级认证没有特定有效期，但是时间太久或版本太老的认证证书会有所贬值。

3、五级认证的关系

五级认证为递进式关系，即只有通过上一级考试科目才能参加下一级认证考试。

4、SAS全球认证的考试方式

考试为上机考试，时间2个小时，共70道客观题。

相关链接

随着中国物流行业的整体快速发展，物流信息化建设也取得一定进展。无论在IT硬件市场、软件市场还是信息服务市场，物流行业都具有了一定的投资规模，近两年的总投资额均在20-30亿元之间。 *** 对现代物流业发展的积极支持、物流市场竞争的加剧等因素有力地促进了物流信息化建设的稳步发展。

易观国际最新报告《中国物流行业信息化年度综合报告2006》中指出，中国物流业正在从传统模式向现代模式实现整体转变，现代物流模式将引导物流业信息化需求，而产生这种转变的基本动力来自市场需求。报告中的数据显示:2006-2010年，传统物流企业IT投入规模将累计超过100亿元人民币。2006-2010年，第三方物流企业IT投入规模将累计超过20亿元人民币。

由于目前行业应用软件系统在作业层面对终端设备的硬件提出的应用要求较高，而软件与硬件的集成性普遍不理想，对应性单一，因此企业将对软件硬件设备的集成提出更高要求。

物流行业软件系统研发将更多的考虑运筹学与数据挖掘技术，专业的服务商将更有利于帮助解决研发问题。

物流科学的理论基础来源于运筹学，并且非常强调在繁杂的数据处理中找到关联关系(基于成本-服务水平体系)，因此数据挖掘技术对于相关的软件系统显得更为重。

Ⅲ 数据挖掘统计的课程内容是什么

哥们，我是做数据挖掘的研狗，了解一些生物科技方面大数据的应用。

首先听回过的所有的数据答挖掘的报告中，有具体成果的全都是国外的机构，可能是我听的少，国内的生物科技数据挖掘都是讲理论。这东西讲理论有个毛用。

如果有资本的话（年龄、家庭支持），还是找个好学校读研，本身生物科技+数据挖掘就比较高端。

数据挖掘和数据统计不是一样的。。。。

简单的拿工资讲，北京硕士毕业进数据分析岗位，8k一月，如果进的是数据挖掘团队，大概能有20w~30w

每年。

Ⅳ 数据分析有哪些相关的培训课程

据分析师的课程包括两个层面的内容，只有把数据分析师的这些课程都学会并且运用，你就可以成为一名顶级的大数据分析师。

一、课程层面

第一级别：数据分析课程内容主要是从理论-实操-案例应用步步进阶，能让学员充分掌握概率论和统计理论基础，能够熟练运用Excel、SPSS、SAS等一门专业分析软件，有良好的商业理解能力，能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析，并得出逻辑清晰的业务报告。

第二级别：在第一级别的基础上,第二级别包括建模分析师与大数据分析师，即为企业决策提供及时有效、易实现、可信赖的数据支持。建模分析师，指在ZF、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。本课程针对数据挖掘整套流程，以金融、电信、电商和零售业为案例背景深入讲授数据挖掘的主要算法。并将SAS Enterprise Miner、SPSS Moderler、SAS编程和SQL进行有效的结合，让学员胜任全方位的数据挖掘运用场景。大数据分析师，本课程以大数据分析为目标，从数据分析基础、JAVA语言入门和linux操作系统入门知识学起，系统介绍Hadoop、HDFS、MapRece和Hbase等理论知识和hadoop的生态环境，详细演示hadoop三种模式的安装配置，以案例的形式，重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。通过演示实际的大数据分析案例，使学员能在较短的时间内理解大数据分析的真实价值，掌握如何使用hadoop架构应用于大数据分析过程，使学员能有一个快速提升成为兼有理论和实战的大数据分析师，从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。

二、数据分析师的知识结构

Ⅳ 大数据挖掘学习课程一般学习多长时间

在北京学过，5个月。魔据据说条件不错，但是还是要试听考察的。不管是否有基础学习都是没有问题的，主要看的是自身学习是不是用心，够不够努力，也可以去实际了解一下。

Ⅵ SAS数据挖掘的课程内容是什么

数据挖掘课程包括：

sas/data miner模块，包括sas/data

miner模块的常用工具，对商业问题的界定、导入数据、内数据探视、变量转换、数据集设置容、缺失值处理、各种预测、描述类分析算法、模型评估、显示得分结果等。通过培训使学员掌握使用sas的data

miner（数据挖掘）模块，能够利用sas/data miner对一些常见的商业数据进行数据分析，挖掘出商业价值。

来源。商业智能和数据仓库爱好者

提供，，，，商业智能和云计算，。、，，陪训，。，。包含SAS数据挖掘课程

Ⅶ 数据分析数据挖掘培训课程哪个好

你好，多比较多分析，要多听一听大家的口述意见。

Ⅷ 大数据挖掘学习课程需要多久

去年学的学了5个月，魔据条件不错，我自己认为五十人左右还是可以接受的，但是还是自身要足够努力才行，像有些机构一百人以上，那就有点接受不了了，感觉老师也顾忌不过来不要去，可以去实际考察一下。

Ⅸ 大数据专业主要学什么课程

大数据技术专业属于交叉学科：以统计学、数学、计算机为三大支撑性学科；生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。

此外还需学习数据采集、分析、处理软件，学习数学建模软件及计算机编程语言等，知识结构是二专多能复合的跨界人才(有专业知识、有数据思维)。

以中国人民大学为例：

基础课程：数学分析、高等代数、普通物理数学与信息科学概论、数据结构、数据科学导论、程序设计导论、程序设计实践。

必修课：离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论、计算机系统基础、并行体系结构与编程、非结构化大数据分析。

选修课：数据科学算法导论、数据科学专题、数据科学实践、互联网实用开发技术、抽样技术、统计学习、回归分析、随机过程。

(9)数据挖掘相关课程扩展阅读：

大数据岗位：

1、大数据系统架构师

大数据平台搭建、系统设计、基础设施。

技能：计算机体系结构、网络架构、编程范式、文件系统、分布并行处理等。

2、大数据系统分析师

面向实际行业领域，利用大数据技术进行数据安全生命周期管理、分析和应用。

技能：人工智能、机器学习、数理统计、矩阵计算、优化方法。

3、hadoop开发工程师。

解决大数据存储问题。

4、数据分析师

不同行业中，专门从事行业数据搜集、整理、分析，并依据数据做出行业研究、评估和预测的专业人员。在工作中通过运用工具，提取、分析、呈现数据，实现数据的商业意义。

5、数据挖掘工程师

做数据挖掘要从海量数据中发现规律，这就需要一定的数学知识，最基本的比如线性代数、高等代数、凸优化、概率论等。经常会用到的语言包括Python、Java、C或者C++，我自己用Python或者Java比较多。有时用MapRece写程序，再用Hadoop或者Hyp来处理数据，如果用Python的话会和Spark相结合。

Ⅹ 攻读数据挖掘方向的研究生需要本科学习过哪些课程

就学基础的计算机课程即可，因为研究生的时候还会开设一些有关数据挖掘的课程。

三、游戏开发中会用到哪些常用AI算法

游戏开发指利用计算机编程语言，如C编程语言、C++、java等，编写计算机、手机或游戏机上的游戏。目前流行的游戏开发语言为C++编程语言，目前流行的游戏开发接口为DirectX9.0，还有OpenGL、SDL(Simple DirectMedia Layer)等。现在手机上玩的游戏分为Android与IOS两种不同平台，分别是用eclipse/MyEclipse和xcode。现在也流行一些跨平台的编程引擎，例如cocos2d-x、unity 3D等。

接下来，再看看游戏开发的课程，游戏开发的课程除了理论知识还包括软件的操作。

C++程序基础：通过学习C++语言，奠定编程基础。使用VS.net2005编译工具，高效构建代码。

算法与数据结构：通过学习算法与数据结构的基本概念，了解常用的数据结构及相关的抽象数据定义，认识计算机求解的基本思路与方法。

Win32程序入门：通过API和MFC的学习，熟悉Windows环境下程序设计基本方法。通过使用DirectX绘制2D图形。

游戏数学和智能应用：游戏中的坐标系，矢量、矩阵，几何碰撞，物理模拟，人工智能与寻路算法。

2D游戏技术与应用：2D 游戏技术概论，游戏地图系统，GUI 系统，战斗系统设计，任务系统优秀的声音引擎 BASS，Cocos2D-X 引擎，Box2D 物理引擎。

游戏开发的常用软件有C++、DirectX、Box2D、Cocos2d-x、Unity，不能说哪款最好用，因为这是游戏开发过程中都要用到的软件，必须都精通。

C++是在C语言的基础上开发的一种通用编程语言，应用广泛。

DirectX，（Direct eXtension，简称DX）是由微软公司创建的多媒体编程接口。

Box2D是一个用于模拟2D刚体物体的C++引擎。zlib许可是一个自由软件授权协议，但并非copyleft。

Cocos2d-x是一个开源的移动2D游戏框架，MIT许可证下发布的。这是一个C++ Cocos2d-iPhone项目的版本。

Unity是由Unity Technologies开发的一个让玩家轻松创建诸如三维视频游戏、建筑可视化、实时三维动画等类型互动内容的多平台的综合型游戏开发工具，是一个全面整合的专业游戏引擎。

四、生活中的人工智能之搜索和推荐算法

姓名：陈心语学号：21009102266 书院：海棠1号书院

转自：人工智能在搜索中的应用_u014033218的专栏-CSDN博客

人工智能在搜索的应用和实践_qq_40954115的博客-CSDN博客

【嵌牛导读】日常生活中的搜索和推荐算法也与人工智能有所关联，让我们一起来看看吧！

【嵌牛鼻子】人工智能运用于搜索和推荐算法。

【嵌牛提问】人工智能在搜索和推荐算法中有什么运用呢？

【嵌牛正文】

智能交互

智能交互有三个方面的这部分组成，第一个就是Query推荐，这是比较古老的课题；第二个做智能导购，这是现在正在做的一个原形，后面我会讲为什么做智能导购；第三个内容的展示和个性化的创意。就是说你把商品怎么展示给用户，也是我们认为是交互的一部分。

第一个是Query推荐，这个问题怎么来抽象呢？Query推荐是一个用户当前Query下面我们怎么推荐其它Query，这是我们相关搜索一样的。我们推荐这样的一个Query以后，如果用户一旦点了其中的一个Query，用户的状态就会发生变化，从当前的Query跳到另外一个Query，这是用户状态的变化。第二个就是说我们怎么评价我们推荐的Query的好坏，它由几部分组成，一个Query有没有被点，第二个就是说推荐Query里面，它的SRP页会不会点，因为Query推荐本质上不是Query推荐做的最好就是最好的，它是说最终要在搜索SRP用户有没有买，有没有点击，这才是做的好的，这是第二个收益。还有一个更加间接的，通过Query推，这个状态转到下一个状态以后，这个里面还会推其它Query，还会有其它点击，这个时候也是个间接推荐。如果我不推Query就不能到这个状态，不到状态不会有这个Query，不会有这个收益。我们了解，这就是典型的一个马尔科夫决策过程，我们是用强化学习来做的，Actions就是我们的Query list，根据用户和当前Query推荐其他Query，状态就是User + Query，收益就是包括推荐Query击，还有一个间接收益，间接收益通过bellman 公式可以算出来，这就是一个DQN的强化学习项目。

智能导购

现在的搜索呈现的问题就是说，如果去看搜索的Query都是一些品类词、品牌词、型号词或者属性词。假定用户他知道买什么再来搜索搜，但是有各很大的东西用户不知道买什么吗？智能导购就是做做一个类似智能导购机器人的产品，引导用户怎么搜，用户也可以主动问，获取知识或购物经验。这是后台的算法的一个原形，不久后会上线。

智能内容

因为淘宝的商品，卖家为了适应我们的引擎，做了大量的SEO，里面都是罗列热门的关健词，导致问题淘宝的标题没什么差异，都写的差不多，看标题也不知道什么东西，或者知道但里面没有很多特色的内容。我们做智能内容很重要的出发点是怎么从商品的评价、详情页、属性里面挖出一些比较有卖点，或者商品比较有特色的东西展示给用户，让用户更好的了解商品，这是第一个。第二个淘宝上面还有类似商品聚合的，比如清单，生成一个清单，怎么给清单生成一个比较好的导入的描述，让用户描述这个清单干什么。这里面主要做了这两个事情。具体怎么做的？一个会生成一些Topic，比如行业运营加上我们挖的一些点，比如像手机一般大家关注点会是手机的性价比，拍照是不是清晰，还有速度是不是快，是不是发热什么的，这是用户关注的兴趣点。然后它会根据这个商品会选择一个兴趣点，通过Seq2seq生成短文本。

语义搜索

我们的商品属性基本上是比较标准化的，因为这里淘宝有一个这样的商品库，非标准化的内容是没法上传的。导致的问题是我们的商品内容相对来说是比较规范化的，但是用户的输入的Query不是这样的，比如我这里举一些例子，比如一个新品有各种表达，2017新品，2017冬季新品，是吧？新品，有很多的表达。所以就是从从用户的需求跟商品的内容，就存在了一个语义的Gap。还有我们经常举例，比如三口之家用的电饭锅，很多这种语义的问题，这个语义从语义角度解决语义Match的事情。

大概会有这么几个方面。比如一个就是意图的理解，还有意图的Mapping，比如大容量冰箱，首先知道大的是跟冰箱的容量相关的，冰箱是个类目，最后要Mapping到人的冰箱，把‘大’改写成一个容量大于多少升，类目是冰箱这样才能够比较好的解决我们这个搜索的这个召回的问题。第二个语义理解，这里面包括Query和商品都要做语义理解，比如通过image tagging计算从图片里面抽取很多文本的语义标签补充到商品文本索引中。第三个就是现在有这个端到端的深度学习技术来直接学Query和商品的Similarity，通过端到端的深度学习技术来做语义的召回和语义的相关性。

智能匹配

主要就是讲个性化，做个性化的首要就是个性化数据。个性化本质上就是说以用户为中心构建用户的标签，用户的行为，还有用户的偏好，再通过这些数据找到，去Match到商品，比如说你看过相似商品，典型的协同过滤，还有你偏好的品牌的其它商品。那就是基于这些经历了一个以用户为中心的电商图谱，这里面还加了一些辅助的数据，比如商品的相似度，店铺之间的相似度，这样构建了我们这样的叫电商图谱。

个性化召回与向量化召回

召回是这样的，首先从咱们的电商图谱里取出用户的信息，包括比如说年龄性别，还有当地温度是多少，还有行为足迹等等之类的，社交现在没用了，因为这是几年前社交特别火，什么都要掺和一下，其实社交，信息的社交到电商其实风马牛不相及的领域，没有任何价值。所以现在好友这东西几乎没有用。因为不同Query中，用户信息重要性是不一样的，我们根据上下文会做用户信息的筛选或者排序，会找出比较重要的信息做个性化召回。以上是淘宝商品索引结构，传统的搜索关键字是通过搜索关键字召回，而个性化商品索引，除了Query还会有商品簇，簇与簇之间的关系，品牌店铺等等之类的，会加很多个性化的特征做召回，通过这种带的好处是召回的结果跟用户是直接相关的，就召回这一步带来个性化。

但是这种基于行为召回还是存在一个问题的。最重要的问题它的泛化能力会比较差。最典型的比如说你通过协同过滤来做，如果两个商品，没有用户同时看过的话，这两个商品你认为他们相似度是零，这个结论是错的，但是如果通过协同过滤就有这个问题。我们今年实现了向量化召回，包括两步：一个是Similarity learning，通过这个深度学习做端到端的Similarity learning，就会把这个我们的User 和Item会变成一个向量；第二步就是做向量化召回，比如层次聚类，随机游走，learning to hash等,这样的话就是说会极大的提升召回的深度。

个性化工作

在个性化领域其实最重要的一个核心的问题就是怎么去理解用户，怎么感知用户和预测用户行为及偏好。

首先是数据，用户在淘宝有两个中类型重要的基本信息：一个是用户标签，比如年龄、性别、职业等；第二是用户足迹，比如点过，买过的商品，店铺等；

其次是用户感知要和搜索上下文相关，即这个用户的表征和要用户搜索意图相关；

第三是搜索有很多差异化的任务，比如用户消费能力的预估， User到Item的CTR预估和用户购物状态预估等，是为每个任务做个端到端的深度学习模型还是用统一的用户表征来完成不同的Task？如果每一个任务都做端到端深度学习会有很多问题，比如离线和在线的性能开销会大很多，或部分任务样本太少。

如图是用户感知深度模型，输入X是用户的点击行为序列，下一步是embedding，embedding完以后，通过LSTM把用户行为序列做embedding，因为在搜索用户感知和Query相关，所以加入query 的 attention层，选择和当前query有关系的行为，表征完是Multi-task learning 网络。整个这个网络的参数大概有一百亿个参数，我在双11我们还实现了在线学习。

算法包括智能交互、语义搜索、智能匹配和搜索策略四个方向。

智能交互

商品搜索就是带交互的商品推荐，用户通过关键字输入搜索意图，引擎返回和搜索意图匹配的个性化推荐结果，好的交互技术能够帮助到用户更好的使用搜索引擎，目前搜索的交互主要是主动关键字输入和关键字推荐，比如搜索框中的默认查询词和搜索结果中的文字链等，推荐引擎根据用户搜索历史、上下文、行为和状态推荐关键字。和商品推荐的区别是，关键字推荐是搜索链路的中间环节，关键字推荐的收益除了关键字的点击行为外，还需要考虑对整个购物链路的影响，包括在推荐关键字的后续行为中是否有商品点击、加购和成交或跳转到另外一个关键字的后继行为，这是一个典型的强化学习问题，action 是推荐的关键字候选集合，状态是用户当前搜索关键词、上下文等，收益是搜索引导的成交。除了被动的关键字推荐，我们也在思考搜索中更加主动的交互方式，能够做到像导购员一样的双向互动，主动询问用户需求，挑选个性化的商品和给出个性化的推荐理由，目前我们已经在做智能导购和智能内容方向的技术原型及论证，智能导购在技术上主要是借鉴对话系统，通过引导用户和引擎对话与关键字推荐方式互为补充，包括自然语言理解，对话策略，对话生成，知识推理、知识问答和商品搜索等模块，功能主要包括：a. 根据用户搜索上下文生成引导用户主动交互的文本，比如搜索“奶粉”时，会生成“您宝宝多大？0~6个月，6个月到1岁….”引导文案，提示用户细化搜索意图，如果用户输入“3个月”后，会召回相应段位的奶粉，并在后续的搜索中会记住对话状态“3个月”宝宝和提示用户“以下是适合3个月宝宝的奶粉”，b. 知识导购，包含提高售前知识问答或知识提示，比如“3个月宝宝吃什么奶粉” 回答“1段”，目前对话技术还不太成熟，尤其是在多轮对话状态跟踪、知识问答和自动评价几个方面，但随着深度学习、强化学习和生成对抗学习等技术在NLP、对话策略、阅读理解等领域的应用，越来越多的训练数据和应用场景，domain specific 的对话技术未来几年应该会突飞猛进；智能内容生成，包括生成或辅助人工生成商品和清单的“卖点”，短标题和文本摘要等，让淘宝商品表达更加个性化和多元化。

语义搜索

语义搜索主要是解决关键字和商品内容之间的语义鸿沟，比如搜索“2~3周岁宝宝外套”，如果按照关键字匹配召回结果会远小于实际语义匹配的商品。语义搜索的范围主要包括：a. query tagging和改写，比如新品，年龄，尺码，店铺名，属性，类目等搜索意图识别和归一化，query tagging模型是用的经典的序列标注模型 bi-lstm + CRF，而标签分类（归一化）作为模型另外一个任务，将序列标注和分类融合在一起学习；b. query 改写，主要是计算query之间相似度，把一个query改写成多个语义相似的query，通常做法是先用不同改写策略生成改写候选query集合，比如词替换、向量化后top k、点击商品相似度等，然后在用ltr对后续集合排序找出合适的改写集合，模型设计和训练相对简单，比较难的是如何构建高质量的训练样本集合，线上我们用bandit 的方法探测部分query 改写结果的优劣，离线则用规则和生成对抗网络生成一批质量较高的样本； c. 商品内容理解和语义标签，通过商品图片，详情页，评价和同义词，上下位词等给商品打标签或扩充商品索引内容，比如用 image tagging技术生成图片的文本标签丰富商品内容，或者更进一步用直接用图片向量和文本向量融合，实现富媒体的检索和查询；d. 语义匹配，经典的DSSM 模型技术把query 和商品变成向量，用向量内积表达语义相似度，在问答或阅读理解中大量用到多层LSTM + attention 做语义匹配，同样高质量样本，特别是高质量负样本很大程度上决定了模型的质量，我们没有采样效率很低的随机负采样，而是基于电商知识图谱，通过生成字面相似但不相关的query及相关文档的方法生成负样本。从上面可以看到query tagging、query相似度、语义匹配和语义相关性是多个目标不同但关联程度非常高的任务，下一步我们计划用统一的语义计算框架支持不同的语义计算任务，具体包括1. 开发基于商品内容的商品表征学习框架，为商品内容理解，内容生成，商品召回和相关性提供统一的商品表征学习框架，重点包括商品标题，属性，详情页和评价等文本信息抽取，图像特征抽取和多模信号融合；2. query 表征学习框架，为query 类目预测，query改写，query 推荐等提供统一的表征学习框架，重点通过多个query 相似任务训练统一的query表征学习模型；3. 语义召回，语义相关性等业务应用模型框架。语义搜索除了增加搜索结果相关性，提升用户体验外，也可以一定程度上遏制淘宝商品标题堆砌热门关键词的问题。

智能匹配

这里主要是指个性化和排序。内容包括：a. ibrain (深度用户感知网络)，搜索或推荐中个性化的重点是用户的理解与表达，基于淘宝的用户画像静态特征和用户行为动态特征，我们基于multi-modals learning、multi-task representation learning以及LSTM的相关技术，从海量用户行为日志中直接学习用户的通用表达，该学习方法善于“总结经验”、“触类旁通”，使得到的用户表达更基础且更全面，能够直接用于用户行为识别、偏好预估、个性化召回、个性化排序等任务，在搜索、推荐和广告等个性化业务中有广泛的应用场景，感知网络超过10B个参数，已经学习了几千亿次的用户行为，并且会保持不间断的增量学习越来越聪明； b. 多模学习，淘宝商品有文本、图像、标签、id 、品牌、类目、店铺及统计特征，这些特征彼此有一定程度的冗余和互补，我们利用多模学习通过多模联合学习方法把多维度特征融合在一起形成统一的商品标准，并多模联合学习中引入self-attention实现特征维度在不同场景下的差异，比如女装下图片特征比较重要，3C下文本比较重要等；c. deepfm，相对wide & deep 模型，deepfm 增加了特征组合能力，基于先验知识的组合特征能够应用到深度学习模型中，提升模型预测精度；d. 在线深度排序模型，由于行为类型和商品重要性差异，每个样本学习权重不同，通过样本池对大权重样本重复copy分批学习，有效的提升了模型学习稳定性，同时通过融合用户状态深度ltr模型实现了千人千面的排序模型学习；e. 全局排序，ltr 只对单个文档打分然后按照ltr分数和打散规则排序，容易导致搜索结果同质化，影响总页效率，全局排序通过已知排序结果做为上下文预测下一个位置的商品点击概率，有效提升了总页排序效率；f. 另外工程还实现了基于用户和商品向量的向量召回引擎，相对倒排索引，向量化召回泛化能力更强，对语义搜索和提高个性化匹配深度是非常有价值的。以上实现了搜索从召回、排序特征、排序模型、个性化和重排的深度学习升级，在双11无线商品搜索中带来超过10% (AB-Test)的搜索指标提升。

智能决策

搜索中个性化产品都是成交最大化，导致的问题是搜索结果趋同，浪费曝光，今年做的一个重要工作是利用多智能体协同学习技术，实现了搜索多个异构场景间的环境感知、场景通信、单独决策和联合学习，实现联合收益最大化，而不是此消彼长，在今年双11中联合优化版本带来的店铺内和无线搜索综合指标提升12% (AB-Test)，比非联合优化版本高3% (AB-Test)。

性能优化

在深度学习刚起步的时候，我们意识到深度模型inference 性能会是一个瓶颈，所以在这方面做了大量的调研和实验，包括模型压缩(剪枝)，低秩分解，量化和二值网络，由于缺少相应的指令集和硬件支持，最终只在个别场景下上线，期待支持低精度矩阵计算和稀疏矩阵计算的硬件早日出现。

未来计划

通用用户表征学习。前面介绍的DUPN 是一个非常不错的用户表征学习模型，但基于query 的attention 只适合搜索，同时缺少基于日志来源的attention，难以推广到其他业务，在思考做一个能够适合多个业务场景的用户表征模型，非搜索业务做些简单fine tuning 就能取得比较好的效果；同时用户购物偏好受季节和周期等影响，时间跨度非常大，最近K个行为序列假设太简单，我们在思考能够做life-long learning 的模型，能够学习用户过去几年的行为序列；搜索链路联合优化。从用户进入搜索到离开搜索链路中的整体优化，比如搜索前的query 引导（底纹），搜索中的商品和内容排序，搜索后的 query推荐（锦囊）等场景；跨场景联合优化。今年搜索内部主搜索和店铺内搜索联合优化取得了很好的结果，未来希望能够拓展在更多大流量场景，提高手淘的整体购物体验；多目标联合优化。搜索除了成交外，还需要承担卖家多样性，流量公平性，流量商业化等居多平台和卖家的诉求，搜索产品中除了商品搜索外还有“穹顶”，“主题搜索”，“锦囊”，“内容搜索”等非商品搜索内容，不同搜索目标和不同内容（物种）之间的联合优化未来很值得深挖。

以上就是关于人工智能十大经典算法相关问题的回答。希望能帮到你，如有更多相关问题，您也可以联系我们的客服进行咨询，客服也会为您讲解更多精彩的知识和内容。