1月13日,应中国科学院深圳先进技术研究院邀请,美国俄亥俄州立大学张晓东教授到院访问交流,并作了题为《数据表在大数据处理中分布存储的基本结构与应用》的学术报告,报告由冯圣中研究员主持。
张晓东教授介绍了在大型分布式数据仓库中广泛使用的存储结构RCFile及其存在的不足,以此为基础引出了优化RCFile的方法,并在ORC File存储结构中实现与验证。目前,ORCFile已开始在大型生产系统(比如Hive)上使用。
张晓东教授是美国俄亥俄州立大学 Robert M. Critchfield讲席教授,并担任该校计算机科学与工程系主任,ACM Fellow,IEEE Fellow,获得2010年中国计算机学会海外杰出贡献奖。张晓东教授主持研究的一些核心算法和系统设计已被广泛应用到商业处理器以及主要操作系统、数据库系统和大型分布式系统中,有效地优化或更新了计算机和分布式系统中的一些关键技术。
大数据是中国科学院深圳先进技术研究院的重要方向,承担了中科院先导专项等重要项目,已经凝聚了数十位学者,以城市安全态势感知、智慧健康、智能交通等重大应用为牵引,在大规模多媒体处理与管理、大规模图数据分析与应用、低功耗计算等方面已经取得了具有国际影响的科研成果,是我国大数据方向一支重要的技术创新和产业创新力量。

讲座现场