kaiyun官网
News Center
新闻中心
新闻中心 您的位置: 首页 > 新闻中心
AI创投周报|帷幄发布多款升级版AGI产品英伟达Q3营收同比增长206%
2023-11-25 22:12:07 作者: 新闻中心

  原标题:AI创投周报|帷幄发布多款升级版AGI产品,英伟达Q3营收同比增长206%

  AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

  1.阿尔法公社在天使轮投资的帷幄发布多款升级版AGI产品,包括「AGI云Alivia正式版」、「帷幄数智空间Whale SpaceSight 3.0」、「帷幄内容营销中心Whale Harbor 4.0」等,旨在帮助品牌深入应用场景,打造高效、智能的解决方案,实现可持续商业增长。

  2.OpenAI研发神秘“Q*”模型,这款模型由OpenAI首席科学家Ilya Sutskever牵头开发,能力十分强大,甚至引发了AI安全人士的担忧,成为Altman此前被罢免的导火索。

  3.视觉大模型创新涌现,表现在两方面,一是视频大模型增多,包括Stable Video Diffusion、Emu Video等,第二是视觉生成可编辑更加普及。

  近日,阿尔法公社天使投资项目Whale帷幄在其秋季发布会上展示了在AI领域的最新成果,包括多款升级版AGI产品,涵盖文字生成、图片创作、视频剪辑等多种功能,旨在优化使用者真实的体验和业务运营模式。

  这些产品有「AGI云Alivia正式版」、「帷幄数智空间Whale SpaceSight 3.0」、「帷幄内容营销中心Whale Harbor 4.0」、「帷幄绘声Whale Echo 1.0」、「帷幄开播Whale Cast」等,旨在帮助品牌深入应用场景,打造高效、智能的解决方案,实现可持续商业增长。

  帷幄还发布了针对不一样的行业的数字化解决方案,如汽车行业的「的卢」方案、家居家装行业的「鲁班」方案等,这些方案覆盖了从客服到销售的所有的环节,旨在提升运营效率和商业模式创新。例如,「的卢」方案通过智能客流分析和门店服务质检,优化客户体验;「鲁班」方案则帮助家居公司实现个性化与规模化的品牌内容生产。

  此外,帷幄还推出了「2023 生态合作伙伴计划」,旨在招募数字化门店技术的领先落地者,共同开发解决方案,以更好地满足本土品牌的数字化转型需求。帷幄还提供了多本AGI实战运营手册,如《Whale SpaceSight 0-100 解锁门店商业与数据价值手册》等,帮企业实现标准化管理和消费者洞察。

  2.OpenAI研发神秘“Q*”模型,此模型或是Altman被罢免的导火索

  这款模型的能力惊动了一些专注于人工智能安全的研究人员,这个Sutskever在7月份组建的安全团队,致力于限制比人类聪明得多的人工智能系统的威胁,他们担心该公司没有适当的保护措施来商业化这种先进的人工智能模型。

  据知情人士透露,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)向员工表示,关于“Q*”取得人工智能技术突破的信,是促成前董事会采取行动罢免Altman的原因。

  Stability AI推出名为Stable Video Diffusion的视频生成模型,Stable Video Diffusion是目前为数不多的开源商业视频生成模型之一。它允许用户基于静态图像生成几秒钟的视频,展示了在视频生成技术方面的新突破。

  技术上,Stable Video Diffusion是一种高分辨率视频潜在扩散模型,能够实现文本到视频或图像到视频的转换,并达到了行业领先水平。该模型通过在小型高质量视频数据集上进行微调,将原本用于2D图像合成的潜在扩散模型转变为视频生成模型。Stability AI在其论文中详细介绍了成功训练视频潜在扩散模型的三个阶段:图像预训练、视频预训练和高质量视频微调。

  目前这个模型仍然处于小规模试用阶段。Stability AI计划在这个基础上建立和扩展各种模型,形成类似于围绕Stable Diffusion建立的生态系统。Stability AI强调,目前Stable Video Diffusion还不适用于直接的商业应用,他们将根据用户对安全和质量的见解和反馈来完善该模型。

  Stable Diffusion虽然应用广泛,但是图像生成速度较慢,限制了对实时性和互动性要求较高的应用。为解决这一问题,谷歌研究团队提出了UFOGen模型,这是一种能够极速采样的扩散模型变种,能够在一步中生成高质量图片,同时保留Stable Diffusion的下游应用能力。

  UFOGen的核心创新在于它结合了扩散模型和生成对抗网络(GAN)的优势。传统的扩散模型依赖于多步降噪过程,而UFOGen通过改变生成器的参数化方式和重构损失函数的计算方法,实现了一步生成的目标。此外,UFOGen的生成器和判别器均由Stable Diffusion模型初始化,最大限度地利用了关于图片和文字关系的内部信息。

  在实验中,UFOGen展示了其在一步采样中生成高质量、符合文字描述的图片的能力,即使与50步采样的Stable Diffusion相比,UFOGen生成的样本在视觉上也不逊色。

  Meta最近推出的两项生成式AI技术—Emu Edit和Emu Video,标志着其在视频生成和图像编辑领域的重大突破。这些技术不仅在质量上超越了现有的Gen-2和Pika Labs解决方案,而且提供了更高的灵活性和创造力。

  Emu Edit是一个先进的图像编辑模型,它允许用户通过文字指令对图像进行自由形式的编辑。这包括本地和全局编辑、添加或删除背景、颜色和几何变换、以及检测和分割等任务。Emu Edit的独特之处在于它能够精确地遵循指令,确保输入图像中与指令无关的像素保持不变。例如,用户可以指示模型给鸸鹋穿上裙子,或者将草地上的小狗移除,而不影响图片的其他部分。

  Emu Video则是一个基于扩散模型的文生视频模型,能够基于文本生成高分辨率的4秒视频。这个模型通过将文生视频问题分解为两个子问题来提高视频生成的质量和多样性:首先根据输入的文本提示生成图像,然后根据图像和文本的强化条件生成视频。这种方法使得Emu Video在生成质量和文本忠实度方面都取得了显著的进步。

  Inflection-2在保持多倍于Inflection-1规模的同时,降低了服务成本并提高了服务速度。这标志着向为每个人构建个人AI的目标迈出了重要一步,Inflection-2将在Pi中启用新的功能。

  马斯克近日在社交平台X发文称,AI模型Grok会在下周对所有X Premium+订阅者开放。(内测申请入口:)据悉,Grok可以与用户进行智能、幽默和多任务的对话,可以让用户选择不同的语气和人格,并根据用户的兴趣和需求提供个性化的推荐建议。

  它还可以实时访问X平台上的海量数据,从中学习和理解最新的热门话题和事件。此外,它支持超长提示词,快速响应,多个对话同时输出。XAI计划在未来增加图像生成、图像识别、音频识别等多模态的能力,还可以在特斯拉汽车上利用车载算力本地运行。

  OpenAI安全系统团队负责人Lilian Weng撰文探讨了大语言模型(LLM)面临的对抗攻击问题及其防御策略。文章指出,尽管大多数商用和开源LLM都具备一定的内置安全机制,但这些机制并不足以全面防御各种形式的对抗攻击。

  文章详细介绍了对LLM的对抗攻击类型,包括基于token操作的攻击、基于梯度的攻击等。其中,token操作攻击通过简单的词汇替换等方法诱使模型做出错误预测,而基于梯度的攻击则利用模型的内部信息来进行更精准的攻击。此外,文章还探讨了越狱prompt设计,即通过特定的词汇组合诱使LLM输出有害内容,以及更为隐蔽的攻击方法,例如通过对话中的特定触发器来诱发有害响应,这类攻击在多轮对话中难以察觉。

  在防御方面,文章提到了多种策略,如使用高质量的分类器来判断输出内容的安全性,以及人类审查等。

  DeepMind近日公布了最新研究成果Student of Games(SoG)算法,标志着人工智能在博弈领域的一大进步。SoG算法的独特之处在于它的通用性,能够适应完美信息博弈(如围棋、国际象棋)和不完美信息博弈(如扑克牌、Scotland Yard)。

  SoG算法结合了引导式搜索、自我对弈学习和博弈论推理,通过成长树虚拟遗憾最小化(GT-CFR)算法进行优化。GT-CFR算法能够在游戏过程中进行局部搜索,非均匀地构建子博弈,并将树扩展至最相关的未来状态,同时迭代地细化价值与策略。这种方法使SoG能够在不同的游戏中自由发挥,并教会自己如何与自己的另一个版本进行对战,从而学习新策略并逐渐变得更有能力。

  SoG算法的实验结果表明,它在四种不同的游戏中展示了强大的性能:两种完美信息博弈(国际象棋和围棋)和两种不完美信息博弈(扑克和Scotland Yard)。特别是在Scotland Yard这种需要长期规划的游戏中,SoG展现了其卓越的策略制定能力。

  与AlphaZero相比,SoG利用最少的领域知识,将搜索与自我对弈相结合。其搜索算法基于虚拟遗憾最小化,对完美和不完美信息博弈都是有效的。这一特性使SoG在处理各种博弈中表现出色,为真正通用的人工智能算法迈出了重要一步。

  10.达摩院医疗AI攻克胰腺癌早筛难题,2万病例中仅发现31例漏诊,成果登上顶级期刊《Nature Medicine》

  胰腺导管腺癌(PDAC)是一种致命的恶性肿瘤,通常在晚期被发现,早期发现与生存期延长有关。然而,由于低患病率和假阳性的风险,使用单一检测筛查PDAC仍然具有挑战性。近期,阿里达摩院医疗AI团队与多家机构合作,在《Nature Medicine》发表了一篇研究论文,提出了一种新的胰腺癌早期筛查方法:“平扫CT+AI”。

  这项研究开发了一种名为PANDA(Pancreatic Cancer Detection with Artificial Intelligence)的方法,能够通过平扫CT检测和分类胰腺病变,实现高精度的诊断。PANDA在多中心验证和真实世界临床验证中表现出色,其胰腺癌识别的敏感性和特异性均优于放射科医生。

  PANDA不仅提高了早期诊断和治疗的机会,降低了医疗成本,还提高了筛查覆盖率,减轻了患者负担,并对社会健康产生了积极影响。

  英伟达近日公布了其截至2023年10月29日的第三季度的财报,第三季度英伟达营收为181.2亿美元,同比增长206%,环比增长34%。本季度GAAP摊薄每股收益为3.71美元,同比增长超过12倍,比上一季度增长50%。非GAAP摊薄每股收益为4.02美元,同比增长近6倍,环比增长49%。

  另一方面,英伟达首席财务官Colette Kress当地时间11月21日在公司三季度业绩说明会上证实,英伟达正在为中国开发新的合规芯片,但表示这些不会对第四季度的收入做出实质性贡献。

  数字欺诈是增长最快的欺诈类型,2023年至2027年全球在线支付欺诈造成的累计商户损失将超过3430亿美元,全球金融机构在金融犯罪合规方面的支出超过2060亿美元。此外,洗钱每年给英国经济造成超过1000亿英镑的损失,英国金融机构每年在金融犯罪合规方面的支出超过342亿英镑。

  Lynx利用其欺诈预防、反洗钱和网络安全风险识别能力的洞察力,通过不断增加其数据集来增强人工智能和机器学习模型。Lynx可以在不到15毫秒的时间内处理企业级交易量,并生成比当前行业标准准确三倍的欺诈分数。目前,Lynx正在帮助欧洲、英国、美国和拉丁美洲的领先金融机构,其解决方案效果遥遥领先于竞争对手。

  Lynx由Carlos Santa Cruz博士创立并担任CTO,其核心技术也由它研发,Carlos Santa Cruz于1991年获得马德里自治大学物理学博士学位,1995年至今在马德里自治大学担任计算机科学与人工智能教授。

  Qevlar AI构建了一个生成式人工智能解决方案,以自动化取代手动网络安全调查和检测流程,Qevlar AI解决方案的核心是自动调查API,它能快速自动分析潜在安全事件,消除人工干预的瓶颈,并将人类专家需要几小时才能完成的调查任务缩短到一分钟内。

  Qevlar AI技术可与组织现有的任何现有安全基础设施无缝集成,从而实现快速集成。数据显示,利用Qevlar AI的企业的安全运营效率提高了 30%,随着技术的成熟,这一数字将在未来几个月继续增长。

  3.多模态生物医学人工智能公司Manifold.AI获得1500万美元A轮融资

  Manifold.AI的主要产品为Science Cloud,这是一款AI驱动的用于多模态生物医学数据的云平台。Science Cloud能够将用户的数据集中到一起,并将其转换为标准化模型以便进行更简化的分析。

  同时在数据管理与搜索层面,Science Cloud中所有的研究资产都会在专门构建的知识图谱中自动编入索引,同时通过用部落知识对其进行注释或将其映射到标准词汇表本体的方式丰富对资产的上下文理解。

  Science Cloud搭载的AI辅助搜索可以让用户以更自然的方式与数据进行交互,从而更轻松地定位原始数据集、派生数据集、数据应用程序,大幅度减少了搜索时间。Science Cloud预构建环境包含了大部分常见的科学计算工具,如JupyterLab、RStudio、NextFlow和VSCode。

  企业如何获得全面市场动向,识别并优化营销相关数据,在高效率的同时获得实时的决策支持是一个亟需考虑的问题。OfferFit提供自动化营销增长平台,使用人工智能技术帮助营销人员对客户的行为和爱好进行深度分析,在大量的营销数据中挖掘高价值信息,提供有力的数据支持,帮助公司实现业务增长和持续发展。

  Keychain旨在帮助消费品公司找到合适的制造合作伙伴(可理解为代工厂),它打造了一个AI驱动的平台,帮助超过10000+家制造商与品牌和零售商进行智能匹配。他们的目标是将寻找制造合作伙伴的过程从几个月缩短到几天,从而推动消费品行业的创新和产品开发。

  Keychain的产品还处于邀请制阶段,并计划在明年向特定的零售商和品牌开放。未来,Keychain计划扩大业务范围,帮企业处理包括采购、合规在内的全制造过程,以成为一个综合性的一站式CPG制造解决方案提供商。

  Atlas主要打造的是生成式3D模型,支持图生3D和文字生成3D,它声称把3D建模项目实现的速度提高了200倍。它的主要客户是游戏开发商,它能帮助客户在更短的时间内创建与现有知识产权一致且可部署的虚拟世界和创意资产。Atlas目前的合作伙伴包括Consortium 9、Shrapnel和Square Enix等。

  目前,Atlas仅提供给企业和商业用户使用,但计划在未来几个月内开始公共平台的alpha测试。该公共平台将面向小型和独立开发者,允许用户上传资料对AI模型进行个性化微调。

  Atlas的创始人Ben James是一位自学编码者,并且有相关建筑学背景。他之前是FTI的高级咨询师,也在设计和技术交叉领域有丰富的经验。

  本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。