习近平总书记在主持中共中央政治局第九次集体学习时强调:“人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。”人工智能具有多学科综合、高度复杂的特征,在推动其快速发展的各项技术中,算法至关重要。当前,“算法”一词也频繁出现在公众视野,深度学习、智能推荐广泛应用在我们的日常生活中。
源于数学,在信息社会发挥巨大作用
“算法”即算的法则,它起源于数学,指解决某些“类数学”问题规范而完整的方法。人们熟悉的“加减乘除”、欧几里得《几何原本》里的演绎推理基本法则等,都属于算法。中国古代数学有深厚的算法传统,《周髀算经》用文字记载勾股算法,三国时期刘徽提出圆周率的割圆术算法,后来祖冲之由此计算出圆周率为3.1415926。现代逻辑学,特别是数理逻辑,则为算法提供了完善的形式化语言描述。这种形式语言及公理系统方法,为现代算法发展打下良好的语言基础。
现代算法与计算机技术密不可分。1946年世界上第一台电子计算机诞生,此后计算机性能不断提升,其强大的运算能力将人类从重复、机械的繁琐推导和计算中解放出来。对计算机来说,算法就是处理信息的原理与遵循。理想状态下,算法能够将人的思维过程以形式化的方式输入计算机,使其可以不停地执行命令以实现所设定的目标。而现实生活中,算法是与计算机架构、指令、通信、调度方式等相关联的运行过程,需要结合时间和空间不断优化。
由此可见,我们通常所说的算法可分为两个层次。一是数学和逻辑层次的算法,它刻画人类思维和解决问题的逻辑过程,这一过程可以通过形式语言或数学公式来描述。二是计算机算法,它是固定化的计算方法与步骤,是解决现实问题的计算机执行过程。其中,计算机算法本质上是将人的逻辑思维过程与计算机的计算过程相融合来解决问题,它是数学、逻辑学与计算机深度交叉、人机融合的成果。在社会信息化、智能化程度不断提高的过程中,计算机算法扮演着越来越重要的角色,发挥着巨大作用。
深度学习算法,打开人工智能突破口
当前,深度学习是各类算法中最具代表性的一种。深度学习是一类特殊的机器学习算法,其概念源于人工神经网络,目的是探索和模拟人的思维规律,仿照脑神经系统结构与信息处理机制,构建智能软件系统。深度学习通过学习算例数据的内在规律和表示,使计算机能够像人一样有分析能力,为人工智能质的飞跃打开突破口。从发展前景来看,以深度学习为重要基础,人工智能将深刻影响人们的生活,甚至实现科幻电影中的人机交互场景。
把人类思维活动变成算法的奇妙过程,究竟是怎么实现的?深度学习将人的思维过程概括为“接受数据”“总结规律”“形成判断”三个环节,分别对应人工神经网络结构中的输入层、隐藏层和输出层。就像人们看到红灯就停下,绿灯亮了再过马路一样,在深度神经网络中,输入层接收到信号后,会经过处理将其传递给隐藏层进行分析和总结,最后由输出层做出判断。由于面对的问题往往比“红灯停、绿灯行”更复杂,输入层与输出层之间有很多隐藏层,需要综合分析判断,而这正是深度学习的“深”之所在。“接受数据”“总结规律”“形成判断”这样的加工过程不可能一次完成,深度学习通过算例数据的反复输入和输出层的及时反馈,按照预测误差极小化原则,不断调整神经网络的联结参数,以最终实现对算例数据所含规律和内蕴结构的总结。
深度学习算法最为大众所知的案例,就是围棋“人机大战”。深度学习算法战胜围棋高手的前提,是大量的“自我训练”。从技术上说,其输入信号包括人类围棋顶尖高手的3000万步围棋走法。隐藏层达12个,每一层包含数百万个人工神经元,用来建模棋盘及棋法。“决策网络”负责走棋策略,“价值网络”负责评估态势并预测环境,最后由输出层做出决策判断。隐藏层利用经验数据及自我对弈数据来训练神经网络,这一训练的目的是确定神经元之间的连接权重(参数)。不少人会问:它怎么找到每一步棋的最优解?答案是“经验”。算法从经验中学习,基于部分经验数据提出一个初始特征,进而得出一个输出结果。然后,利用其他经验数据或自我对弈结果,校验输出结果,不断调整完善,以找到更合适的参数。在这一过程中,计算机持续通过简单的概念来学习、构建更复杂的概念,通过组合低层特征形成更加抽象的高层特征。与传统的学习方法相比,深度学习预设了更多参数、对应模型更大,因此训练难度更大,所需要的算例数据也更多。这也是深度学习依赖于大数据的缘由。所以,不少观众感叹:“这盘棋的每一步,也许深度学习算法都已经练过许多次了!”
深度学习算法推动人工智能实现从“不可用”到“可以用”的重大突破。如今,深度学习已经是一个标准化的从大量数据中总结经验、挖掘结构的万能工具,在科学技术、工商管理、医疗健康等领域发挥重要作用。可以说,深度学习已经成为通过计算机算法拓展人类认知能力的一项基础技术。
夯实数理基础,促进算法健康、有序、繁荣发展
未来,算法将帮助我们解决更多生产生活中的问题。如果说现实世界由原子分子构成,那么数字世界的基本元素则是数据。要想让数字技术有效赋能现实世界,提升生产力,就要对现实场景进行数字化描述并制定解决方案。这既需要用科学家的严谨思维建立模型,也需要用工程师的务实手段解决问题,算法正是数学理论和工程实践相结合、批量化解决问题的高效手段。比如人脸识别技术,应用的就是计算机视觉算法。这一算法顾名思义,首先要获得物体的数字图像,然后利用计算机规则理解、分析图像并得到结论。除了人脸识别,计算机视觉算法也被应用于图像检索、视频监测、智能驾驶,等等。在其他领域,算法也大有用武之地。在量子计算中,算法为量子力学提供全新的计算视角;在气象领域,算法可以帮助预测气象灾害;在医疗领域,分布式微剂量CT通过低成本的CT终端采集数据,再经由云端强大的计算集群自动调度算法实现成像和智能阅片,有助于解决偏远地区看病难问题。
目前,算法的不断进步主要基于大数据。我国在人工智能领域拥有数据量庞大的优势,有助于机器学习发展。与此同时,提高算法创新能力必须重视基础研究,重视数学的独特作用和价值。数学不仅为算法创新提供模型和工具,也为算法的发展提供思想源泉。算法应用场景也会对数学理论提出新的问题与挑战。发展新的数学理论和工具来解决相关算法问题,将成为应用数学的重要方向。另外,算法在带来便捷的同时,也出现了信息茧房、算法歧视等问题,需要规划和预判技术逻辑和伦理逻辑,在应用中兼顾社会价值、伦理道德,践行科技向善理念,从而实现更好的算法治理。
智慧城市、智能制造、智慧医疗、智慧教育……进入智能社会,算法提供了普遍适用的逻辑过程和运行框架。相信在新一轮科技革命和产业变革中,我国相关科研工作者将继续勇立潮头,探索攀登,让有智慧、有温度的算法更好地服务经济建设和国家发展。
文章刊发于2022年8月16日人民日报20版
报道链接://paper.people.com.cn/rmrb/html/2022-08/16/nw.D110000renmrb_20220816_1-20.htm