〇 知识目标[br](1)掌握信息熵、条件熵、信息增益及信息增益比的含义。[br](2)掌握决策树算法ID3、C4.5、CART 的优点。[br](3)掌握正则项与稀疏解的概念。[br](4)掌握朴素贝叶斯定理与公式。[br](5)理解人工神经网络的含义。[br](6)了解神经网络的正向及反向传播过程。[br](7)掌握支持向量机、硬间隔支持向量机的含义。[br](8)掌握马尔可夫链的应用。[br](9)掌握非线性支持向量机的含义。[br]〇 能力目标[br](1)能够应用决策树ID3、C4.5、CART 的算法。[br](2)掌握正则项与稀疏解的概念。[br](3)能够应用人工神经网络理论的算法。[br](4)掌握朴素贝叶斯定理与公式。[br](5)掌握硬间隔支持向量机的原理。[br](6)掌握非线性支持向量机。[br](7)能够应用马尔可夫链理论。[br]〇 素养目标[br](1)培养学生处理大数据的理论、方法意识。[br](2)培养学生处理大数据的数学思维。[br](3)拓宽学生对大数据技术的应用领域。[br]〇 德技并修[br]大数据分析有助于找到问题的解决方案,如降低成本、节省时间并降低决策风险。[br]大数据越来越多地和人工智能关联起来。所谓人工智能,就是利用数学统计方法,统计[br]数据中的规律,然后利用这些统计规律进行自动化数据处理,使计算机表现出某种智能[br]的特性,而各种数学统计方法,就是大数据算法。[br]大数据算法的开发和使用需要高水平的数学、统计学、计算机科学等多学科知识,[br]需要掌握多种算法和技术,如机器学习、数据挖掘、自然语言处理等。同时,大数据算[br]法也需要大量的数据,以便于模型的训练和验证。因此,大数据算法的开发和使用需要[br]强大的计算资源和存储空间,以及高效的数据管理和处理系统。另外,大数据算法也面[br]临着各种挑战,如数据偏差、数据泄露、算法偏见等问题。因此,在开发和使用大数据[br]算法时,需要高度重视数据的质量和算法的透明度,以确保算法的准确性和公正性。[br]〇 项目说明[br]本项目包括9 个任务:决策树算法、聚类算法、朴素贝叶斯算法、K 近邻分类算法、[br]关联规则、逻辑回归、人工神经网络、支持向量机、马尔可夫链及自然语言处理等,使[br]学生掌握大数据分析的基本算法,包括分布式计算、并行计算和数据挖掘算法等。