2024年已行进尾声,但对于生成式AI而言,这又是波澜壮阔的一年。
Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。
基座大语言模型不再持续狂飙,不仅价格战、营销战硝烟燃起,融资热度降温,Scaling Law是否撞墙更是在年底引发热议。不过行业赋能持续进行,包括智能体在内的应用层的兴起仍然备受期待。同时,大模型向边端下沉的趋势日趋明显,AI手机、AI PC等AI硬件纷纷站上风口。
GPT-4o的出现,将轻量化模型和端侧大模型推向新高度之余,端侧设备的交互革新也有了前进方向。不止AI硬件,大模型驱动下的具身智能更是热度空前,人形机器人正开启星辰大海。
而作为支撑大模型运行以及生成式AI应用开发的关键,AI Infra也走到了台前,从智算集群到基础软件,发展势头强劲,但挑战不少。
在上述背景下,2024中国生成式AI大会(上海站)「GenAICon 2024」将于12月5-6日在上海中星铂尔曼大酒店盛大举办。中国生成式AI大会已成功举办两届,迅速成长为国内生成式AI领域最具影响力的产业峰会之一。
此次也是中国生成式AI大会首次登陆上海举办。大会由智一科技旗下智能产业第一媒体智东西、AI与硬科技知识分享社区智猩猩共同发起主办。上海市人工智能行业协会为大会的指导单位。
大会上海站以“智能跃进 创造无限”为主题,50+位嘉宾将带来致辞、演讲、报告和对话讨论,基于前瞻性视角解构和把脉生成式AI的技术产品创新、商业落地解法、未来趋势走向与前沿研究焦点。
上海站由“主会场峰会+分会场研讨会+展览区”组成。主会场将进行大模型峰会、AI Infra峰会,分会场将进行端侧生成式AI技术研讨会、AI视频生成技术研讨会和具身智能技术研讨会。展览区则紧邻会场门口设置,14家企业将进行技术产品展示。
大会主会场将进行「大模型峰会」和「AI Infra峰会」。主会场邀请到30+位来自学术界和工业界的知名学者、公司创始人及技术决策者参加,他们将以主题演讲、高端对话、圆桌讨论等不同形式,分享在大模型和AI Infra上的技术突破、产品创新、应用实践和前沿探索。
今天为大家正式揭晓主会场峰会的完整议程。
一、主会场峰会完整议程
二、大模型峰会演讲介绍
大模型峰会将于12月5日进行,将由上海市人工智能行业协会党支部书记、副秘书长徐琦进行大会致辞,智一科技联合创始人、CEO龚伦常代表主办方致辞。复旦大学计算机科学技术学院教授、上海市智能信息处理实验室副主任张奇将以《大语言模型的能力边界与发展思考》为主题,带来开场报告。
MiniMax副总裁刘华,银河通用机器人合伙人、大模型负责人、北京智源人工智能研究院具身智能PI张直政,北京大学(临港)大模型对齐中心执行主任、北京阿莱门科技有限公司首席执行官徐骅,西湖大学助理教授张驰将围绕多模态大模型开放平台、具身智能、多模态对齐、通用图像单目深度估计大模型在上午带来主题演讲。
同时,大模型峰会上午场将进行高端对话,由智一科技联合创始人、智车芯产媒矩阵总编辑张国仁主持,华映资本海外合伙人邱谆、BV百度风投执行董事温永腾、达晨财智晨云子基金合伙人朱翔参与共同探讨《大模型时代,资本市场的新风向》。
在大模型峰会下午场,联汇科技CEO兼首席科学家赵天成,VAST CTO梁鼎,腾讯优图实验室天衍研究中心负责人、专家研究员吴贤,西湖心辰CEO、西湖大学深度学习实验室成果转化负责人醒辰,RockAI CTO杨华,趣丸科技副总裁贾朔,蚂蚁集团资深算法专家李龙飞,WeMeet 荟神创始人顾学斌,华院计算大模型和知识推理算法负责人蔡华9位大咖将参与,深入分享他们在3D生成、医学、情感、音乐生成、金融、法律等不同领域的大模型探索和应用实践。
演讲嘉宾:复旦大学计算机科学技术学院教授、上海市智能信息处理重点实验室副主任 张奇
演讲主题:《大语言模型的能力边界与发展思考》
内容概要:2023年大型语言模型迎来了迅猛的发展,在自然语言处理、智能问答、文本创作等多个领域展现出了前所未有的能力。这一系列令人瞩目的成果,使得各界对于通用人工智能(AGI)的实现满怀憧憬与期待,甚至有不少乐观的预测认为,基于大模型构建的通用人工智能在短时间内便会成为触手可及的现实。然而,在这一片乐观的喧嚣背后,我们更需冷静思考:大语言模型那令人惊叹的能力究竟源自何处?其能力的拓展是否存在着无法逾越的边界?大语言模型未来又将沿着怎样的路径持续演进与发展?本次介绍就将围绕上述这些问题展开初步的深入探讨,以期抛砖引玉,让大家对大语言模型有更为透彻与清晰的认知。
演讲嘉宾:MiniMax副总裁 刘华
演讲主题:《多模态大模型开放平台探索与实践》
内容概要:多模态大模型正在重新定义人工智能的应用边界。通过整合文本、图像、音频、视频等多种形式的数据,多模态大模型在许多领域展现了强大的理解和生成能力。随着模型能力的不断提升,多模态大模型不仅正在助力形成新质生产力,还在多个行业场景中展现出巨大的潜力。
此次演讲MiniMax将分享如何在多模态大模型研发中不断创新,并实现大模型技术的快速落地。通过不同的实际案例,MiniMax将向大家展示如何利用多模态大模型技术解决不同行业场景的复杂问题。
演讲嘉宾:银河通用机器人合伙人、大模型负责人,北京智源人工智能研究院具身智能 PI 张直政
演讲主题:《具身智能从“专”到“通”之路》
内容概要:机器人从“专用”到“通用”的发展是具身智能的使命,而大模型技术是推动这一发展的关键。本报告将首先从数据、模型、系统的角度介绍对于具身智能的Scaling Law探索,并介绍这一探索的重大意义。其次,报告将深入剖析机器人从“专用抓取”到“通用抓取”,从“通用抓取”到“通用操作”,再到面向终局的端到端具身大模型的科研思路和最新成果。最后,报告将讨论这一系列前沿探索在相关产业中形成新质生产力的诸多机会和可能性。
高端对话嘉宾:华映资本海外合伙人 邱谆
邱谆,现任华映资本海外合伙人,加入华映前历任德迅、云九、复星、弘毅等双币VC合伙人;硅谷工作20多年,历任Cisco、Brocade硅谷总部技术高管,腾讯云计算早期T4专家架构师兼技术总监;北京大学计算机本科,美国南加州大学USC人工智能多Agent博士方向,机器人世界杯RoboCup冠军队成员,拥有多项专利和AI顶会论文。
高端对话嘉宾:BV百度风投执行董事 温永腾
温永腾先生现负责BV百度风投人工智能应用赛道,关注生成式AI技术及应用的投资机会。他从事科技领域投资多年,曾主导投资了西湖心辰、生数科技、诗云科技、云舶科技、数字力场、粒界科技等科技公司。
高端对话嘉宾:达晨财智晨云子基金合伙人 朱翔
朱翔,达晨财智晨云子基金合伙人,同济大学软件工程硕士,中欧商学院MBA ,主要覆盖AI和具身智能方向。
演讲嘉宾:北京大学(临港)大模型对齐中心执行主任、北京阿莱门科技有限公司首席执行官 徐骅
演讲主题:《破解大模型安全与实用性矛盾:多模态对齐的探索与实践》
内容概要:本次演讲将首先介绍当前大模型面临着两难境地,过于安全可能致其无用,而安全性不足则可能引发隐患,亟需找到安全与实用的动态平衡。之后,将重点介绍北大研究团队探索的对齐技术的多样化框架。包括基于人类反馈的强化学习RLHF;针对复杂场景的灵活对齐工Aligner;多模态对齐技术,实现语言、图像、视频等信息的高效融合;以及Inference Time对齐实现推理阶段实时调整输出。接着会分享多模态对齐技术的实践案例,多模态对齐目前已应用于医疗影像分析和处方检查,RLHF+Aligner能够提升法律问答准确性,多模态对齐助力具身智能领域的智能驾驶座舱和机器人交互。在未来,我们致力于推动从研究到产业的深度融合,推动RLHF与Aligner技术在更多领域的纵深应用,构建面向严肃场景的高效推理对齐框架,支持实时响应和个性化调整。使对齐技术驱动生成式AI在医疗、教育、法律等领域的行业变革,促进生成式AI在社会中的可信落地。
演讲嘉宾:西湖大学助理教授 张驰
演讲主题:《通用图像单目深度估计大模型》
内容概要:单目深度估计旨在从单张图像中预测场景的深度信息。与双目深度估计相比,单目深度估计具有更高的应用灵活性,但也面临缺乏三维信息导致的复杂性和不确定性问题。近年来,单目深度估计在自动驾驶、机器人导航和生成式人工智能等领域获得了广泛关注。最近的研究趋势集中于全场景通用的单目深度估计大模型的开发。传统的深度估计模型通常针对特定场景进行训练,难以在多样化的场景中取得理想的性能。而全场景通用的单目深度估计大模型旨在实现一个能够适配多种复杂场景的模型,显著提升其通用性和鲁棒性。为了实现这一目标,研究者们在过去两年中在多个方面取得了重要进展。本次报告将讨论几个学界重点关注的研究方向,包括如何利用海量无标注或弱标注数据来增强模型的泛化能力,如何设计更有效的监督训练范式和损失函数,以及如何更好地利用大模型的先验知识来提升深度估计的精度和稳定性。
演讲嘉宾:联汇科技 CEO兼首席科学家 赵天成
演讲主题:《以智能体为中心的AI原生应用和开源生态》
内容概要:智能体作为应用前沿,正在重塑技术与场景之间的互动方式。本次演讲以智能体的开发与应用为核心,重点介绍Om Agent平台在AI原生应用中的实践,包括如何快速构建、部署和管理AI原生应用,让每个智能硬件设备具备人类认知级别的智能体,快速适应、赋能各种场景,以及在不同行业与领域的原生应用案例。同时,强调构建开源生态也是推动智能体应用创新的重要依托,更多开发者的加入与应用的产生将能够服务更广泛的用户,让每个人都能真正地享受到技术创新成果。
演讲嘉宾:VAST CTO 梁鼎
演讲主题:《大模型加持,3D AIGC的发展与应用》
内容概要:我们生活在三维世界中,但由于创作成本高昂,很难像拍照或录视频一样轻松创作3D内容。随着3D AIGC技术的不断发展,这种局面正在逐渐改变。
本报告将聚焦3D AIGC技术,详细解析其在大模型生成浪潮中的进展和最新成果,并探讨技术推动下的多领域应用实践,为未来3D创作的普及提供新思路。
演讲嘉宾:腾讯优图实验室天衍研究中心负责人、专家研究员 吴贤
演讲主题:《从深度学习到大模型,医学AI上的一些尝试》
内容概要:在医学领域,几乎所有的通用 NLP 任务都可以找到相应的实际应用场景,例如医患对话、医学信息提取、疾病诊断、药物推荐以及报告生成等。目前,已有大量的研究将 LLM应用于医学领域,部分大型模型甚至已经高分通过了医师资格考试。然而,仍有许多问题需要进一步研究。本次分享旨在深度探索大模型技术在医学领域的研究和应用问题,包括训练效率问题,包括幻觉问题,包含在临床场景中实际遇到的问题等。
演讲嘉宾:西湖心辰CEO、西湖大学深度学习实验室成果转化负责人 醒辰
演讲主题:《让AI懂人心,说人话——多模态情感大模型的应用探索》
内容概要:语言、文字的发明都是为了沟通和交流,在AI技术高速发展的今天,人机交流的种种矛盾也被放到台前。“AI不明白我的意思”,“AI理解不了我的心情”大众对此很有共鸣,也是一定程度上排斥AI的原因。AI的智商虽然关键,情商更为重要,它是AI与人类和谐共存的基石。
怎么让AI模型懂人心?说人话?西湖心辰自创立以来一直深耕打造“高情商”“超拟人”的AI模型,并且持续探索其应用边界,以期为公众带来福祉并创造社会价值。
在本次演讲中,将重点介绍我们的模型能力在心理领域的落地应用,包括端到端多模态识别与交互、长程对话能力以及情感感知等关键能力。用实际案例证明AI模型不论是基于文字还是语音都能懂人心、说人话,共同探讨AI在个性化心理健康服务领域的未来发展。
演讲嘉宾:RockAI CTO 杨华
演讲主题:《非Transformer架构大模型Yan在端侧的实践》
内容概要:本次演讲将探讨生成式AI在端侧面临的挑战,详解国内首个非Transformer架构大模型Yan的技术路线及其落地应用,还将分享大模型从单体智能到群体智能的发展路径。
演讲嘉宾:趣丸科技副总裁 贾朔
演讲主题:《让每个人体验音乐创作——音乐生成大模型的创新实践》
内容概要:随着AIGC技术的成熟和广泛应用,AI和音乐可以碰撞怎样的火花?如何降低门槛让普通用户体验音乐创作的乐趣?趣丸科技推出了自主研发的全球首个多模态音乐生成大模型——天谱乐AI。该模型集成音频处理、深度学习及大数据分析等领先技术,不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,生成的歌曲自带人声唱词,效果达到专业发行水准。
本次演讲聚焦AI音乐,重点分享趣丸科技自研的音乐生成大模型天谱乐AI的初衷、产品研发、应用实践和愿景。AI音乐工具不仅是技术的堆砌,更是用户情感的载体。天谱乐AI通过技术创新降低音乐创作门槛,让用户不再受限于专业的乐理知识,复杂的音乐制作流程和昂贵的版权费用,就可以轻松通过音乐创作记录生活的切片,在创作中提升审美自觉和音乐生产能力。
演讲嘉宾:蚂蚁集团资深算法专家 李龙飞
演讲主题:《生成式大模型在蚂蚁内部的应用和挑战》
内容概要:生成式语言大模型在近两年取得了突破性的进展,在蚂蚁内部也有大量的业务在应用llm来进行各种各样的业务改造和创新,并取得了一些结果,例如蚂蚁的支小宝,医疗管家等业务。在业务应用LLM的过程中也遇到了一些挑战,主要集中在可信,以及效率等方面,例如在模型的部署服务过程中,就面临资源利用率,推理速度等效率相关的问题,在用户的应用过程中也遇到一些和大模型幻觉相关的挑战,本次分享会介绍蚂蚁在这两个方面上的一些工作和尝试。
演讲嘉宾:WeMeet荟神创始人 顾学斌
演讲主题:《基于大模型构建多智能体商务互联平台的实践》
内容概要:76秒创建AI商务应用,顾学斌先生将分享WeMeet荟神如何基于大模型构建多智能体商务互联平台的实践和案例,帮助与会者了解如何精准分析AI应用场景的痛点、需求和用户意图,进而结合大模型和多智能体的技术进展,构建可满足用户和场景中长期需求的平台。
演讲嘉宾:华院计算大模型和知识推理算法负责人 蔡华
演讲主题:《法律大语言模型在社会治理中的落地应用》
内容概要:随着大语言模型(LLM)在自然语言处理和法律推理中的突破性进展,我们正迎来一个法律科技变革的新时代:法律大语言模型能够理解、生成和分析法律文本,全面提升法律服务的效率和公平性。如何将法律大语言模型的认知智能应用于社会治理的广泛领域,从事更多智能化、精准化的法律服务,是法律科技和社会治理研究的重要方向。在此背景下,华院计算实践出了一套面向法律大语言模型应用的产品架构,以智能法律服务的理念帮助政府和企业解决法律服务效率低、资源不足、应用落地难等现实问题。
在本次分享中,我们将介绍该框架的基础概念和原理,并通过具体案例展示法律大语言模型在法律咨询、案件分析和智能审判等任务中的应用。此外,我们还将介绍法律大语言模型的训练方法、推理机制以及在不同法律场景中的实际应用效果,通过这些实践案例展示法律大语言模型如何实现社会治理的智能化和高效化。
三、AI Infra峰会演讲介绍
AI Infra峰会将于12月6日进行,聚焦大模型时代的软硬件基础设施关键技术与建设。
在AI Infra峰会上午场,上海交通大学副教授、无问芯穹联合创始人兼首席科学家戴国浩将带来开场报告,主题为《软硬协同与多元异构,共筑大模型算力底座》。
北电数智智算云负责人郭文,GMI Cloud 亚太区总裁 King.Cui,阿里云智算集群产品解决方案负责人丛培岩,中昊芯英芯片软件栈负责人朱国梁,光羽芯辰创始人兼董事长周强,将在AI Infra峰会上午场带来主题演讲,对全栈AI工厂、AI 企业出海如何补齐算力短板、高性能智算集群、通向个人大模型之路、国产 TPU 芯片 “No CUDA” 软件栈进行分享。
枫清科技创始人兼CEO高雪峰,声网生成式AI产品负责人毛玉杰,腾讯云向量数据库技术负责人谢宇,Jina AI 联合创始人兼首席技术官王楠,Zilliz合伙人、研发VP栾小凡,英飞流创始人兼CEO张颖峰,Alluxio首席架构师傅正佳将参与下午场,并分别针对“从数据到知识:AI 重塑百行千业的基石”、“生成式AI驱动实时互动的技术变革与体验革新、TencentVDB向量数据库、RAG范式下AI Infra的机遇和挑战、“RAG虽强,但向量数据库绝非万灵药”、新一代企业级多模态RAG引擎、高性能AI数据底座带来主题分享。
演讲嘉宾:上海交通大学副教授、无问芯穹联合创始人兼首席科学家 戴国浩
演讲主题:《软硬协同与多元异构,共筑大模型算力底座》
内容概要:在AI技术迅猛发展的今天,算力底座的不充分发展,已成为制约AI广泛应用的主要瓶颈。本报告创新性地将影响AI模型算力供给的关键要素归纳为“软硬协同”与“多元异构”,并集中探讨了算力供给错配的问题。深入分析AI在持续发展和应用落地过程中所面临的算力挑战,并从技术创新和产业实践的角度出发,提出了一种创新的解决方案。该方案旨在持续扩大AI算力供给,提升面向大模型场景的token吞吐效率,降低大型模型部署的算力成本,以推动AI技术的持续进步,促进更多AI应用的成功落地,实现更广泛的社会和经济效益。
演讲嘉宾:北电数智智算云负责人 郭文
演讲主题:《全栈“AI工厂”推动生成式AI可持续创新》
内容概要:回顾人类历史上通用技术的发展,从技术的产生到社会经济结构与生产模式发生根本性变化,需要生产工具和生产系统的整体变革才能促成。今天,汹涌而来的AI也是如此。未来,如何让AI赋能千行百业,成为新质生产力?
本次演讲,北电数智将带来关于人工智能这项通用技术,在中外的产业发展格局差异,进行系统化变革面临的挑战,及北电数智在算力、算法、数据与生态构建方面,全面构建AI生产线的实践思考,以期与产业各方共同推动AI产业的系统性变革,让AI能够真正被使用起来,成为真正的新质生产力。
演讲嘉宾:GMI Cloud 亚太区总裁 King.Cui
演讲主题:《全球化布局:AI 企业如何补齐算力短板,保障GPU集群稳定性》
内容概要:随着全球数字化进程的推进,越来越多的企业希望将自己的 AI 应用拓展到海外市场。然而,AI 出海面临诸多挑战,本次演讲重点关注如何突破算力挑战。
稳定的 GPU 集群对突破算力挑战至关重要。GPU 集群能并行处理海量数据,其稳定性确保计算持续高效。通过合理架构设计、优质硬件支持、智能监控和维护系统等,可保障集群稳定,释放强大算力。GMI Cloud作为一个基于高稳定性 GPU 集群的云计算平台,便为 AI 应用出海提供一系列服务和支持。
本次演讲,将介绍AI出海常见的基础设施问题以及高稳定性的重要性,并着重探讨如何利用 GMI Cloud 的优势,帮助企业突破算力挑战。之后,还将通过成功案例,分享 GMI Cloud 在不同行业应用的实践经验。
演讲嘉宾:阿里云智算集群产品解决方案负责人 丛培岩
演讲主题:《高性能智算集群设计思考与实践》
内容概要:2017年阿里云从多模态搜推场景的需求起步,开始投入智算集群的产品研发,2022年商业化发布,通过自动驾驶、LLM/VLM应用场景的持续打磨,目前已经服务了国内一半以上的大模型企业/科研机构。本次分享主要就智算集群的产品和方案设计方向,呈现阿里云的产品设计思考及实践。
演讲嘉宾:光羽芯辰创始人兼董事长 周强
演讲主题:《通向个人大模型之路》
内容概要:在当今时代,AI和大模型的应用已成为焦点。本演讲将探讨如何利用AI让大模型更加智能,扩大其应用场景,以提高个人的工作效率和生活质量。我们将深入解析其工作原理和优势,并通过实际案例展示大模型在个人服务中的具体应用。此外,本演讲还将探讨当前面临的挑战及未来发展方向,为您揭示通向个人大模型之路的关键所在。
演讲嘉宾:中昊芯英芯片软件栈负责人 朱国梁
演讲主题:《国产 TPU 芯片“No CUDA”软件栈的构建实践》
内容概要:国产自研高性能芯片面临的诸多挑战中,性能和生态是两个不能避免的话题。英伟达的 CUDA 生态帮助了很多类 CUDA 架构公司解决了可用性和部分性能问题,但也带来了诸多自主可控上的担忧。
本次演讲将从实际的芯片软件栈构建思路出发,结合实际 AI 芯片软硬件架构,介绍在真实的大模型落地实践中,多层次软件栈实现所面临的问题、挑战、以及过程中的选型决策。
演讲嘉宾:枫清科技创始人兼CEO 高雪峰
演讲主题:《从数据到知识:AI 重塑百行千业的基石》
内容概要:随着人工智能技术的快速发展,大模型成为了企业智能化的重要工具。然而,要让这些模型真正为企业服务,不仅需要强大的技术,更需要找到技术与业务需求的结合点,充分利用企业多年积累的本地“知识”,构建“知识”为中心的支撑平台,驱动丰富可信的智能化场景的建设。
本次分享将深入浅出地为大家分享如何通过以“数据”和“知识”为核心的方法,将企业的海量数据转化为有价值的知识,并结合创新技术让 AI 更高效、更可靠地解决实际问题。并通过真实案例展示如何帮助企业实现智能化转型,让 AI 技术融入到企业的场景价值当中,从而实现真正的AI+行业的转型与落地。
枫清科技创立以来,一直坚持为客户打造知识引擎与模型算法双轮驱动的新一代智能体平台,在多家行业龙头企业的多智能场景的平台建设中体现了其核心价值。
演讲嘉宾:声网生成式AI产品负责人 毛玉杰
演讲主题:《生成式AI驱动实时互动的技术变革与体验革新》
内容概要:实时互动技术正经历一场从“为人类设计”到“为人类与模型共同设计”的变革。过去十年,实时互动行业完成了从关注服务质量(QoS)到体验质量(QoE)的跨越,推动用户从“听得到”到“听得清”的感受提升。生成式AI的发展,正在开启“跨模态QoE”时代,使实时互动从“听得懂”向“听得心”迈进。
此次演讲主要探讨生成式AI如何驱动实时互动的技术与体验革命,深入剖析AI RTE产品的技术架构及其应用前景。通过解读从服务端AI模块到多模态交互的演进,探讨技术如何突破模态限制,创造更加沉浸式的互动体验。希望激发行业对未来AI RTE的无限可能的探索。
演讲嘉宾:腾讯云向量数据库技术负责人 谢宇
演讲主题:《TencentVDB向量数据库在AI中的实践》
内容概要:随着AI应用的快速发展,向量数据库逐步脱颖而出,越来越多的企业正在或考虑使用向量数据库在企业中业务场景中落地,以发挥更大的数据价值,最终为企业起到降本增效的作用。腾讯云向量数据库团队积累了大量的客户最佳实践,在综合效果、性能、成本等方面有深刻的理解,并致力于打造最好用的向量数据库,在AI时代帮助更多的企业挖掘出更多的数据价值。
本次演讲,谢宇将介绍向量数据库的应用场景和行业中的定位,以及未来定位是什么,并分享VectorDB在RAG中提升效果的实践技巧;此外,还将从索引结构、算法、成本逻辑、稀疏向量、Embedding、多租户等方面阐述VectorDB向量数据库的基本原理和应用实践。
演讲嘉宾:Jina AI联合创始人兼首席技术官 王楠
演讲主题:《从长窗口到多向量:RAG范式下AI Infra的机遇和挑战》
内容概要:在本次演讲中,我们将深入探讨RAG(Retrieval-Augmented Generation)范式在大模型的实际应用中遇到的机遇和挑战。RAG不仅能够补足大模型记忆的不准确性,还有效降低了注入新知识的成本,尤其是在私有知识的访问方面表现出色。尽管长窗口大模型技术取得了长足进步,但其并不会取代RAG范式,反而推动了RAG依赖于支持长窗口输入的向量模型的需求。我们将讨论jina-embeddings作为全球首款支持8k窗口的开源向量模型的成功,以及长窗口输入逐渐成为多模态向量模型的新标配。尽管如此,长窗口模型带来了信息丢失和推理成本上升的挑战,这也催生了多向量表示的需求,以弥补单一向量带来的信息缺失。例如,ColBERT和ColPali分别针对文本和图文内容提供了多向量表示方案,然而支持多向量的AI基础设施仍然不足。此外,RAG的PoC阶段面临着GPU推理成本高、资源利用率低的问题,市场缺乏类似Modal lab的GPU共享服务。通过本次演讲,我们将总结RAG范式的长期发展前景,阐明向量模型在长窗口和多模态输入上的进化需求,并探讨AI基础设施如何更好地支持多向量表示和GPU共享,以降低RAG的应用成本。
演讲嘉宾:Zilliz 合伙人、研发VP 栾小凡
演讲主题:《RAG虽强,但向量数据库绝非万灵药》
演讲概要:RAG(检索增强生成)结合生成式AI与向量数据库,为知识获取与生成开辟了新路径,但落地实践中依然面临数据质量、检索效率、成本控制与安全性等挑战。本次演讲将深入探讨RAG落地的关键实践,向量数据库如何在生成式AI时代发挥更大价值,以及其在性能、精准度与成本间的未来演进方向。
报告嘉宾:英飞流创始人兼CEO 张颖峰
报告主题:《新一代企业级多模态RAG引擎》
内容概要:LLM正在对企业软件生态进行重构,RAG已经成为企业级LLM应用的标准化架构。然而,RAG并非简单的搜索系统,它需要针对来自企业的各种非结构化数据作出处理,准确识别用户意图,帮助LLM在上下文窗口内定位到足够精准的片段,这就意味着它必须成为AI和Data协同工作的最具代表性的载体和场景。随着LLM多模态能力的增强,RAG也需要步入多模态时代,它并不限于对日常图片,音视频的检索增强,还应该涵盖当下占据大部分的非结构化文档,发掘出这些数据的商业价值。本次演讲结合我们在过去的工作,从基础设施角度来给出多模态RAG的工程实践,以及未来如何迭代和演进的趋势。
演讲嘉宾:Alluxio首席架构师 傅正佳
演讲主题:《构建大模型时代的高性能AI数据底座》
内容概要:随着AI技术的发展,尤其是大模型技术的应用,数据量呈现爆炸性增长。AI训练和推理需要处理的数据集规模从几TB增长到PB级别,与此同时,数据往往来自多个数据源,很多数据存放在不同的云服务中。当AI算力集群从这些数据源获取数据时,很容易遭遇带宽低下、延迟较高的困境,使算力资源的宝贵时间白白浪费在等待数据这一环节上。Alluxio 通过帮助企业构建大模型时代的高性能AI数据底座以应对I/O挑战,提升AI算力的效率与性能,被广泛应用于模型训练与推理、自动驾驶、AI制药、金融量化以及视频渲染等场景。
本次演讲,首先会介绍常见的 I/O 挑战及其对 GPU 利用率和整体性能的影响,并着重讲解如何将高性能数据访问层无缝集成到 AI 流水线中,以减少 I/O 开销。最后,将结合实际案例分享提高 AI 工作负载性能的缓存策略。
峰会下午还设置了圆桌讨论环节,将由德联资本执行董事刘景媛主持,Alluxio首席架构师傅正佳,Zilliz合伙人、研发VP栾小凡,英飞流创始人兼 CEO张颖峰三位嘉宾也将参与,共同探讨《大模型行至深水区,AI Infra的新变化与新机会》。
圆桌讨论嘉宾:德联资本执行董事 刘景媛
刘景媛女士拥有7年以上股权投资经验,专注于底层软件、AI、大数据等领域。加入德联资本之前曾供职于金山云,亦有创业经历。投资项目有Dify.AI、君同未来、云帆加速、Quickgame等,拥有清华大学和康奈尔大学硕士学位及北京大学学士学位。
四、报名通道临近关闭 门票有限速来抢票
大会上海站设置了三类电子门票,分别是免费票、通票和贵宾票。免费票申请需经组委会审核,通票、贵宾票均需购买。
持免费票可参加两场主会场峰会(大模型峰会、AI Infra峰会)。持有通票或贵宾票,除了可参加全部两场主会场峰会,还可参加三场分会场研讨会(端侧生成式AI技术研讨会、AI视频生成技术研讨会和具身智能技术研讨会)。详细权益,可通过文末左下角「阅读原文」,直达官网了解后,进行免费票申请或购票参会。
再次提醒!!观众报名通道临近关闭。着急的朋友,也可以扫描下方二维码添加小助手“泡泡”申请免费票或购买门票。已添加过“泡泡”的老朋友,可以给“泡泡”私信,发送“GenAI24”即可报名。
已经申请或购买了门票的朋友们,近期请注意查收来自小助手“泡泡”的微信通知(优先微信,并辅以短信或电话)。届时请务必及时查看并保存您的门票凭证,这是现场参会签到需要的哦~