北京外国语大学陈曙东首先从哲学角度对大数据的基本内涵进行了系统描述,概括了大数据课程研修班的前世今生,揭示了其哲学本质。她认为,大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数据巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据主要来源于网络层数据、社会层面的数据和物理层面的传感器数据三个方面。
陈曙东认为,大数据课程研修班通过“量化一切”而实现世界的数据化,进而改变人类认知和理解世界的方式,带来全新的大数据世界观。陈曙东从哲学的角度对数据世界的主要矛盾、矛盾的本质、矛盾的主要方面进行了深入分析和阐述。她认为,数据世界的主要矛盾是日益增长的大数据挖掘需求同落后的数据分析共享能力之间的矛盾;矛盾的本质在于在大数据时代,任何环节的信息交流均会被加速,信息传输的效能提高,因此对信息处理的速度和结果提出了新要求,数据世界是客观世界经过局域化、简单化后的投影,揭示了联系是普遍存在的、多样的、客观的、有规律可循的。她表示,大数据带来了科学研究的“第四范式”即数据密集型科研,研究相关关系,弱化因果关系,不排斥传统的因果关系,实现唯理论和经验论的数据化统一,从而形成大数据的认识论。
陈曙东认为,从数字化向智能化的提升是未来十年信息产业的发展趋势,大数据的发展实现了从量变到质变,随之而来的是数据驱动创新的智慧社会的到来。陈曙东通过具体案例,展示了大数据在商业创新、政府治理、经济治理、智能制造、智能交通等方面的应用,她认为,在大数据时代,我们几乎每个人都无可避免地被裹挟进来,大数据技术已经渗透到产业链的每一环,传统产业的生产方式、传播方式、服务方式、消费方式、发展方式,都将被重组和重塑,建设大数据生态体系已经成为一种必然。
最后,陈曙东分析了大数据课程研修班的技术发展趋势,对加快建设数字中国提出了自己的见解。她认为,我们首先要建立数据驱动的思维模式,加强顶层设计,夯实数据基础、平台基础、技术基础,坚持问题导向,回归本质、落地服务,在支撑智能应用的核心关键技术如深度学习、认知计算、迁移学习等方面实现突破,在产业发展中跨界融合,打破行业壁垒,在大数据产业生态中合作共赢。
互动环节,陈曙东与现场听众就大数据与隐私保护、大数据立法、大数据与统计学的关系、人工智能发展趋势、人工智能对翻译等语言类专业的影响等问题进行了互动。