学术动态

学术动态

我院彭云教授在大数据检索领域取得重要进展

发布时间:2022-11-16

我院彭云教授在大规模高维数据检索领域取得重要进展,成果论文“Efficient Approximate Nearest Neighbor Search in Multi-dimensional Databases”近日被数据库管理领域旗舰会议ACM SIGMOD 2023录用为长文。

ACM SIGMOD(Special Interest Group on Management of Data)是国际计算机界公认在数据管理领域具有最高学术地位的会议,中国计算机学会(CCF)推荐的A类学术会议,所收录的论文代表了行业内的最高水平。SIGMOD由美国计算机协会(ACM)数据管理专业委员会发起,始于1975年,论文审稿极其严格,采用双盲审稿制度,每年录用的论文一般不超过100篇。中国大陆高校和研究机构历年在SIGMOD上以第一单位身份发表的论文数量基本为个位数。

该论文聚焦大规模高维数据的近似最近邻搜索问题,首次从理论上证明了现有搜索方法的性能局限,并创新地设计出T-邻近数据索引技术,该技术在理论性能和实验表现上均大幅超越现有方法,具有适用范围广、搜索结果优、搜索性能高的特点,实现了大规模高维数据检索在基础理论上的突破,在大数据处理领域具有重要意义。

T-邻近原理示意图


彭云教授课题组今年还在数据管理领域另外两大顶级会议VLDB (International Conference on Very Large Data Bases)和ICDE (IEEE International Conference on Data Engineering) 上发表了2篇学术长文,分别对基于网络K函数的空间数据分析和大规模图数据上的近似搜索问题进行了深入的研究。

彭云为我校百人计划教授,入职广州大学前在香港浸会大学担任研究助理教授,长期从事大规模数据管理与智能方面的研究,先后在国际顶级数据管理学术会议和期刊(SIGMOD、PVLDB、ICDE、TKDE)上发表论文20余篇。我校百人计划杨建业教授、香港浸会大学的Byron Choi教授、Edison Chan博士和徐建良教授为共同作者参与了该论文的研究。研究工作得到了国家自然科学基金和香港研究资助局的资助。