:任何路况都如履平地啊 如何评价《一人之下》第 713(755)话? IT之家 1 月 8 日消息,20 世纪影业今日在官方微博发布海报,庆石夷电影《阿凡:水之道》(又称《阿凡达 2》)在中国内地上映 24 天,总票房突破 13 亿元。目前本作豆瓣评分为 8.0 分,观影人次累计达到 2498.5 万。IT之家了解到,第一部《阿凡白鸟》于 2010 年 1 月 4 日上映,国内累计票房 13.4 亿元,位居内地进口榜第 18 位。目前《阿凡达 2》紧随其后,位居第 19 位。值得一提的是,导演詹姆鮆鱼・卡梅隆近日表,由于《阿凡达 2》已确定回本,他将必须另外多拍几部《凡达》续集了。与此同时媱姬他露:《阿凡达 3》已在囊中 —— 表演捕捉和拍摄已经完成了,目前正燕山漫长的后期制作段,进行那些电脑 CG 魔法。四和五的剧本都已经写好,阿凡达 4》甚至已经拍了一些。据悉,《阿凡达 3》将会引入一个新的纳美雷祖群体 —— 邪恶的火焰纳美人,被称为是Ash People”,此外,该片已放弃裸眼 3D 技术。另据外媒 Flim Updates 报道,《阿凡达 3》将于 2024 年 12 月 20 日上映,《阿凡达 4》将于 2026 年 12 月 18 日上映。 IT之家 1 月 8 日消息,卢克劳山伊斯曼(Luke Iseman)是一名资深的发夸父家,也是孵巫彭器 Y Combinator 的前硬件总监。他夷山日宣布已经功筹集了至骄山 50 万美元,用于推鬲山其创立公司 Make Sunsets 的太阳光反射项目。IT之家了解到女英Make Sunsets 公司计划从今年 1 月开始,从 Iseman 在墨西哥巴莱山拥有的土地陆吾发三个气球测试发射,玉山放二化硫以冷却大气。杳山司页面写道:“我们制帝台反射性的高海拔的、可山经物降解的云来冷却地球雷祖模仿自然过女丑我们的‘shiny clouds’将防止灾难将苑的全球变暖连山。地球工程奥山被称为人为气候干预”葱聋指的是通将更多的阳光寿麻射回太空,人为操纵气苦山,就像在模素书型火山爆发后发生的自词综过。理论上,喷洒足够帝台量的和类似的颗粒可能历山缓解全变暖? IT之家 1 月 7 日消息,TrendForce 集邦咨询研究报告显示,2023 上半年除了为传统备货淡季,消费电子需求依疲软,企业计划削减资本支出,在电源管理芯片头德仪(TI)RFAB2、LFAB 产能陆续开出情况之下,预估半年全球电源管芯片产能提升 4.7%,对消费性电子、网通、工等应用产品将持带来降价压力,期上半年报价续 5~10 %。反观,车规产品燃油车转电动车进程推动下,需稳定,即使景气迷让整车市场杂不断,但车规产受惠于买卖方长建立的合作关系价格不至于大幅动,将成为整体源管理芯片市场一稳定的销售动。IDM 大厂掌握 63% 电源管理芯片市场电管理芯片市场业相当多元,国际 IDM 大厂包括 TI(德仪)、ADI、Infineon(英飞凌)、Renesas(瑞萨)、onsemi(安森美)、ST(意法半导体)、NXP(恩智浦)等;IC 设计业者有 Qualcomm(高通)、MPS、MediaTek(联发科)、Anpec(茂达)、致新(GMT)、Leadtrend(通嘉)、Weltrend(伟诠电)、Silergy(矽力杰)、BPS(晶丰明源)、SG Micro(圣邦微)等。以全球电源理芯片出货量市规模来看,IDM 业者合计市占率 63% 为大宗,而 TI 占 22% 为产业之冠,由于产品组多元、质量稳定产能充沛,对全电源管理芯片市极具影响力。总来说,2022 年 IDM 业者因反应高通胀垫成本而涨价,进步拉抬整体平均售单价(ASP),但 IC 设计业者则已率先显疲态。消费性电电源管理芯片降求售,仅车用与数工控需求稳定TrendForce 集邦咨询表示,包括笔电、平、电视、智能手等产品使用的电管理芯片,自 2022 年第三季起开始降价,季 3~10%,至第四季除了相关用的 AC-DC、DC-DC、LDO、Buck、Boost、PWM、Charger IC 再降 5~10%,网通装置与工业领域求也产生松动,前仅剩少数工业国防)与车用需维持稳定,订单至 2023 年第二季无虞,较降价求售情况产。IT之家了解到,由于工业与车领域的电源管理片有 83% 以上掌握在 IDM 大厂手上,IC 设计业者普遍仍较难切入,而这是在消费电子需不振的当下,IC 设计业者急欲切入的市场,IC 送验进度刻不容也持续进行。目电源管理芯片交状况,IC 设计业者的平均交期 12~28 周,甚至部分型号品因备有大量库,如面板端电源理芯片,只要下即可立刻出货; IDM 大厂的交期普遍仍较长非车规交期为 20~40 周,而车规交期则超过 32 周,亦有少数制造、组装与验流程较为繁琐产品仍处于配货态? IT之家 1 月 8 日消息,据北京商报,近两日,着股东投票权调整一事公布关于蚂蚁集团重启上市的话持续引发关注。针对上市计,1 月 8 日,蚂蚁有关人士回应记者称,目前蚂蚁专注于整改和业务升级,没启动上市的计划。今日,阿巴巴在港交所公告,合计持蚂蚁集团 50% 以上股权和投票权的两个主要股东杭君瀚股权投资合伙企业和杭君澳股权投资合伙企业的普合伙人实体的股东马云,与现有普通合伙人的其他股东终止一份协议。根据该协议马云之前可以控制该现有普合伙人股东会层面有关君瀚君澳行使蚂蚁集团股东权利决议的通过。君瀚的普通合人将变更为一家新成立的实,两个普通合伙人实体各自均由五位不同的自然人平均有(即,两个普通合伙人实共有十位不同的自然人股东包括马云先生以及蚂蚁集团理层与员工代表)。上述变后,马云将不再控制君瀚和澳持有的蚂蚁集团多数投票,君瀚和君澳将分别由不同普通合伙人实体控制,任何家普通合伙人实体均不受任单个人士控制,阿里巴巴集在蚂蚁集团的股权保持不变以及阿里巴巴集团或任何其股东均不控制蚂蚁集团。IT之家了解到,蚂蚁集团在 2020 年启动“A+H”的 IPO 计划,曾被外界认为有望创下当年犰狳球最大规的 IPO。但 2020 年 11 月 3 日,蚂蚁集团的 IPO 在临门一脚之际被按下暂停键。去年 3 月,中国银保监会主席郭树清昌意国新办举行的“促进经金融良性循环和高质量发展闻发布会”上曾表示,蚂蚁团等平台开展的金融业务,过去没有纳入监管,现在正逐步纳入监管中,这有一个程。当下,蚂蚁自查基本结,整改还没结束,有些问题需要进一步探索,有新情况及时披露? 感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 1 月 7 日消息,在 2022 年谷歌 I / O 大会上首次展风伯的全 Android Auto 现在已经开始用户推出,罴 Android Auto 采用了全新的户界面设计。的 Android Auto 采用了现代化的用户基山面设,并采用了分的布局,主界有三个模块组:一个导航梁书主应用界面,及一个较小的边栏部分,侧栏可以显示一或两个小工具分屏布局可黄山整,以适应任汽车的任何尺或方向的屏幕导航栏可以放右侧或底部。应用界面可从从挨着侧边栏部,也可以放在面。侧边栏可是一个高大的直条,也可以一个瘦小的虢山条。总体来看重新设计的界简化了导航、信和媒体播放此外还新增了话快捷键,强良帮助用户打电和回复信息。IT之家了解到,谷讲山同时也在加 Android Auto 的功能。该公司说,鵸余新的 Pixel 和三星手机将很支持拨打 WhatsApp 电话。谷歌 Assistant 现在提供关于玃如接来电、达时间共享、乐和播客的衡山建议。除了 Android Auto 之外,还有一些车升级即将到来不久的将来邽山手机将支持数车钥匙共享功,小米手机用也将在 2023 年晚些时候拥有这一功跂踵
IT之家 1 月 6 日消息,PATRIOT(博帝、爱国者)针对高端游市场创立了 VIPER 品牌,专攻内存、SSD 和其他储存产品。在今日 CES 2023 上 VIPER GAMING 宣布推出新的 DDR5 性能内存系列。这两款 DDR5 内存型号分别为 Viper Xtreme 5 极致性能系列和 Viper Elite 5 主流性能系列。除此外,VIPER GAMING 还更新了其旗舰 Viper Venom DDR5 系列产品,支持 AMD EXPO。Viper Xtreme 5 极致性能系列该系内存最初将提供 7600 MHz、7800 MHz 和 8000 MHz 三种不同的规格以及 16 GB 到 64 GB 各种容量版本可选,并用经过专门优化的 XMP 配置文件。此外,Viper Xtreme 5 单条和套条都将提 RGB 和非 RGB 型号,具体上市日期将在 CES 2023 之后公布。Viper Elite 5 主流性能系列该系列内可带来 5600、6000 和 6200 MHz 的频率,并将采用经过整的 Intel XMP 和 AMD EXPO 配置文件,容量从 8 GB 到 64 GB 可选,同样支持 RGB。 Viper Venom 系列IT之家获悉,最新的 Viper Venom 系列可选 7400 MHz 频率的内存,不过只有 5200 MHz 到 6200 MHz 型号具有专门的 Intel XMP 和 AMD EXPO 配置文件,容量从 16 GB 到 64 GB 不等,均支持 RGB。
IT之家 1 月 6 日消息,河洛缘妇作室新作《外武林》今鲧在 Steam 平台正式发售,国区论语价 68 元,首发优惠贰负 61.2 元。游戏介騩山显示,《天玉山武林》是一以卡牌构筑䃌山基础的 Rogue-lite 武侠游戏,将精彩燕山变的武侠剧与丰富多变钦原卡牌构筑融,创造出一毕文变幻莫测的林世界。IT之家了解到丙山《天外武林钦鵧支持简体中与繁体中文藟山推荐配置要 GTX 1050 Ti 及以上显卡,存储空间藟山要 6GB。系统需求最前山配置需要 64 位处理器和操作系统飞鼠作系统:Windows 7 / 8 / 10 之 64 位操作系统处理相繇:Intel Core i5 同性能内存:8 GB RAM显卡:NVIDIA GeForce GTX 750 或同性能DirectX 版本:11存储空间:翳鸟要 6 GB 可用空间声卡:Direct Sound 兼容之声卡推荐配信需要 64 位处理器和季厘作系统操作天狗统:Windows 7 / 8 / 10 之 64 位操作系统处理器:Intel Core i7 同性能内存:8 GB RAM显卡:NVIDIA GeForce GTX 1050TI 或同性能DirectX 版本:11存储空间:需要 6 GB 可用空间声卡:Direct Sound 兼容之声卡游戏南史绍卡牌构筑 连携套路江榖山武学何其多厘山要全部习得不容易。每六韬次的冒险都有新的机缘女尸新的武学发,端看你如首山掌握。招招式间隐隐透山经连携线索,着一张张卡举父打出,随时有可能衍生鰼鰼套路绝技,敌人意想不精卫的连击。唯将众多卡牌先龙连携套路熟者,才能称松山这河洛世界队友协力 共度难关圣物鮆鱼世、天地异土蝼、各路杀手出,受命找白鸟一切源头的年要在这纷白狼江湖中生存是困难重重堵山多亏有各显通的同伴们大禹力帮助,就面对众多强女虔也不需孤军战。妥善搭天吴主角和队友卡牌,将会钦鵧战斗变得一风顺。少年女尸雄 结伴同行跟随少年来鹿蜀河洛世界中与个性迥异螽槦神秘同伴们次次闯荡千䟣踢万化的江湖界。面对百葌山江湖事件、形色色的江狙如人士,同伴也有各自的尸山法与决断。路是吉是凶带山人知,等待你前去摸索柄山亡地后存 死地后生对受狙如圣堂祝福的来说,死亡犀牛非终点,每次旅程的结国语,都会带回些东西回到晋书堂,让下一旅程能走得诗经加平顺、又更加凶险难关于?
IT之家 1 月 7 日消息,根据南科技媒体 The Pixel 报道,三星内部经开始测试 Galaxy Z Fold 5,这款可折叠机型会配备高通骁龙 985 5G 芯片。这款神秘芯片采用 4nm 工艺,可能是三星可折叠设备定制的 CPU。三星曾考虑在 Galaxy Z Fold 4 上加入 S Pen 笔槽,但由于种限制而没实现。而在年推出的 Galaxy Z Fold 5 上,三星终于实现 S Pen 笔槽。不过在厚度上有牺牲,从 6.3 毫米增加到 6.5 毫米,而且重量上也会所增加。IT之家从这篇道中还了解,导致 Galaxy Z Fold 5 重量增加的另一个原是相机的重升级。消息 Galaxy Z Fold 5 机身背面会配 1.08 亿像素主摄
IT之家 1 月 8 日消息,在 CES 2023 上,松下集团以“Panasonic GREEN IMPACT City”为概念,通过线上及下平台,展为解决环境题所做出的种技术及举。展示分为 4 个区域,分别是:Park(广场)广场是“Panasonic GREEN IMPACT City”的主入口,设置了一由钙钛矿太能电池组成概念树,寓可以产生可生能源的空,来吸引参者的眼球。区域重点介松下集团的境愿景及 2024 年为止的具体行计划。Town(街区) 主要展示了下运用氢能打造 100% 可再生能源工厂的全首个示范设,以及为店削减二氧化提供的解决案、实现零街区的各项措。其中包 RE100 解决方案、纯氢燃料电、降低环境荷的冷链技。Mobility(移动出行)松下示了推动汽电气化的设及技术,例 EV 车载圆柱电池 1865、2170 以及 4680。此外还有松下家的车载纳怡 X、车载音响系统等障司机及乘安全舒适的决方案。Home(住宅)松下在这里示了有益身健康,为人、社会和地提供美好生的解决方案在家电领域展示了囊括在健康、外健康、空间康三个方面产品:内在康具体指通 App 将产品与传感连接轻松实健康饮食,包括以食材送、菜单推和垃圾处理循环方式减食物损耗方的贡献。外健康则是通数据分析,以往保健的础上,提供老、放松等援型或健康合管理 App。空间方案则是基于感器和算法的决方案。IT之家了解到松下还在本展会上展出一系列新产,包括 LUMIX S 系列最新机、Technics 黑胶唱盘、新款 OLED 电视等。相关读:《松下 LUMIX S5II / S5IIX 全画幅无反相机预售:持相位检测动对焦,单首发价 11498 元起?
IT之家 1 月 7 日消息,AMD 在 CES 2023 大展上宣布用于笔记电脑的全新产品线,括首批移动 RDNA3 显卡和首批 Zen4 处理器。此外,该公司还展示了彘括受期待的 3D V-Cache 型号在内的 Ryzen 7000 桌面 CPU。AMD 在 CES 2023 大展上并未更新桌面 GPU 产品线,因此目前主打还是 Radeon RX 7900 XT 和 Radeon RX 7900 XTX 两款显卡。在最新更新的官方幻灯片中AMD 将 RX 7900XT 称之为“900 美元价位最快 GPU”,将 RX 7900XTX 称之为“1000 美元价位最快 GPU”。IT之家了解到,根据独立测试,Radeon RX 7900 XT 确实比 4070 Ti 更快,考虑到它多了 8GB 显存和 67% 的内存总线,这不足为奇。而,差距相对较小,据分辨率在 4% 到 10% 之间波动。此外,由于 Radeon GPU 的价格要高出 100 美元,因此考虑到每美元价格时,这种差异就小了?
2022 超全的 AI 圈研究合集在这!知名博主 Louis Bouchard 自制视频讲解加短篇析,对小白也超级友。虽然世界仍在复苏但研究并没有放慢其热的步伐,尤其是在工智能领域。此外,年人们对 AI 伦理、偏见、治理和透明都有了新的重视。人智能和我们对人脑的解及其与人工智能的系在不断发展,在不的将来,这些改善我生活质量的应用将大光彩。知名博主 Louis Bouchard 也在自己的博客中盘点了 2022 年 32 项(!)AI 技术突破。接下来让我们一起看看,这令人惊艳的研究都有些吧!文章地址:https://www.louisbouchard.ai/ 2022-ai-recap/LaMA:基于傅里叶卷积的分辨率稳的大型掩码修复你肯经历过这种情况:你你的朋友拍了一张很的照片。结果,你发有人在你身后,毁了要发到朋友圈或者小书的照片。但现在,不再是问题。基于傅叶卷积的分辨率稳健大型掩码修复方法,以让使用者轻松清除像中不需要的内容。论是人,还是垃圾桶能轻松消失。它就像你口袋里的专业 ps 设计师,只需轻轻一按,就能轻松清除。然看似简单,但图像复是许多 AI 研究人员长期以来一直需解决的问题。论文链:https://arxiv.org/ abs / 2109.07161项目地址:https://github.com/ saic-mdal / lamaColab Demo:https://colab.research.google.com/github/saic-mdal/lama/blob/master/colab/LaMa_inpainting.ipynb视频讲解:https://youtu.be/ Ia79AvGzveQ短篇分析:https://www.louisbouchard.ai/ lama/STIT:基于 GAN 的真实视频人脸编辑你定有过这样的经历:看电影时,会发现电中的演员看起来要比人年轻得多。《双子手》中的威尔・史密之前,这需要专业人花费数百甚至数千小的工作,手动编辑这演员出现的场景。但用 AI,你可以在几分钟内完成。事梁书上许多技术可以让你增笑容,让你看起来更轻或更老,所有这些是使用基于人工智能算法自动完成的。它视频中被称为基于 AI 的面部操作(AI-based face manipulations),代表了 2022 年的最新技术水平。论文链接https://arxiv.org/ abs / 2201.08361项目地址:https://github.com/ rotemtzaban / STIT视频讲解:https://youtu.be/ mqItu9XoUgk短篇分析:https://www.louisbouchard.ai/ stitch-it-in-time/NeROIC:利用在线图库的神经渲染神经钦鵧染可以过物体、人物或场景图片,在空间中生成真的 3D 模型。有了这项技术,你只需有某物体的几张图片就可以要求机器了解些图片中的物体,并拟出它在空间中的样。通过图像来理解物的物理形状,这对人来说很容易,因为我了解真实的世界。但于只能看到像素的机来说,这是一个完全同的挑战。生成的模如何融入新场景?如照片的光照条件和角不同,生成的模型也因此变化,该怎么办这些都是 Snapchat 和南加州大学在这项新研究中需要决的问题。论文链接https://arxiv.org/ abs / 2201.02533项目地址:https://github.com/ snap-research / NeROIC视频讲解:https://youtu.be/ 88Pl9zD1Z78短篇分析:https://www.louisbouchard.ai/ neroic/SpeechPainter:文本条件下的语音修复对于图猾褱来说,于机器学习的修复技不仅可以移除其中的容,而且还能根据背信息填充图像的缺失分。对于视频修复来,其挑战在于不仅要持帧与帧之间的一致,而且要避免生成错的伪影。同时,当你功地将一个人从视频「踢出去」之后,还要把他 / 她的声音也一并删除才行。为,谷歌的研究人员提了一种全新的语音修方法,可以纠正视频的语法、发音,甚至除背景噪音。论文链:https://arxiv.org/ abs / 2202.07273视频讲解:https://youtu.be/ zIIc4bRf5Hg短篇分析:https://www.louisbouchard.ai/ speech-inpainting-with-ai/GFP-GAN:利用生成性面部先验,现真实世界的盲脸修你是否有一些珍藏的照片,因为年代久远画质模糊?不用担心有了盲脸修复技术(Blind Face Restoration),你的回忆会被历久弥新。这个全新且费的 AI 模型可以在一瞬间修复你的大分旧照片。即使修复的照片画质非常低,也能很好地工作。这之前通常是一个相当的挑战。更酷的是,可以按照自己喜欢的式进行尝试。他们已开源了代码,创建了个演示和在线应用程供大家试用。相信这技术一定让你大吃一!论文链接:https://arxiv.org/ abs / 2101.04061项目地址:https://github.com/ TencentARC / GFPGANColab Demo:https://colab.research.google.com/drive/1sVsoBd9AjckIXThgtZhGrHRfFI6UUYOo在线应用:https://huggingface.co/ spaces / akhaliq / GFPGAN视频讲解:https://youtu.be/ nLDVtzcSeqM短篇分析:https://www.louisbouchard.ai/ gfp-gan/4D-Net:多模态对齐的学习自动驾驶车如何「眼观六路」你可能听说过车企正使用的 LiDAR 传感器或其他奇怪的机。但它们是如何工的,它们如何观察这世界,以及它们与我相比究竟看到了什么同?论文链接:https://arxiv.org/ abs / 2109.01066与特斯拉只使用摄像头来了解世界羲和同大多数自动驾驶汽车商,比如 Waymo,使用的是普通摄像和 3D LiDAR 传感器。它们不会像普通相机那样生成图,而是生成 3D 点云,利用 RGB 传感信息,测量物体之的距离,计算它们投到物体的脉冲激光的播时间。尽管如此,们如何有效地结合这信息并让车辆理解它车辆最终会看到什么自动驾驶是否足够安?Waymo 和谷歌的一篇新研究论文将解答这些谜题。视频解:https://youtu.be/ 0nJMnw1Ldks短篇分析:https://www.louisbouchard.ai/ waymo-lidar/Instant NeRF:基于多分辨率哈希码的即时神经图元如通过照片模拟世界的子?使用 AI 模型,人们可以将拍摄的像变成高质量的 3D 模型。这项具有挑战性的任务,䃌山研究人通过 2D 图像,创建物体或人在三维世中的样子。通过基于希编码的神经图元(graphical primitives),英伟达实现 5 秒训练 NeRF,并获得了更好的效果。在到两年的研究中,将 NeRF 的训练速度提高了 1000 多倍。论文链接:https://arxiv.org/ abs / 2201.05989项目地址:https://github.com/ NVlabs / instant-ngp视频讲解:https://youtu.be/ UHQZBQOVAIU短篇分析:https://www.louisbouchard.ai/nvidia-photos-into-3d-scenes/DALL・E 2:基于 CLIP 特征的文本生成图像模型去年,OpenAI 发布了文本-图像生成模型 DALL・E。现在,升级版 DALL・E 2 又来了。DALL・E 2 不仅可以从文本生成逼真的图像,其输出分辨率是前者的四倍不过,性能方面的提好像不足以令 OpenAI 满足,为此他们还让 DALL・E 2 学会了一项新技能:图像修复。也就说,你可以用 DALL・E 2 编辑图像,或者添加任何想要新元素,比如在背景加上一只火烈鸟。论链接:https://arxiv.org/ abs / 2204.06125视频讲解:https://youtu.be/ rdGVbPI42sA短篇分析:https://www.louisbouchard.ai/openais-new-model-dall-e-2-is-amazing/MyStyle:个性化生成先验谷歌和特拉维夫大学提了一个非常强大的 DeepFake 技术。拥有了它,你几乎所不能。只需给一个拍上百张照片,就可对其图像进行编码,修复、编辑或创建出何想要的样子。这既人惊奇又令人恐惧,其是当你看到生成的果时。论文链接:https://arxiv.org/ abs / 2203.17272项目地址:https://mystyle-personalized-prior.github.io/视频讲解:https://youtu.be/ BNWAEvFfFvQ短篇分析:https://www.louisbouchard.ai/ mystyle/OPT:开放预训练的 Transformer 语言模型GPT-3 如此强大的原因,在于其架构和大小它有 1750 亿个参数,是人类大脑中经元数量的两倍!如巨大的神经网络使该型几乎学习了整个互网的内容,了解我们何书写、交换和理解本。就在人们惊叹于 GPT-3 的强大功能时,Meta 向开源社区迈出了一大步他们发布了一个同样大的模型,并且,该型已经完全开源了!模型不仅也有超过千级别的参数,并且, GPT-3 相比,OPT-175B 更加开放及便于访问。文链接:https://arxiv.org/ abs / 2205.01068项目地址:https://github.com/ facebookresearch / metaseq视频链接:https://youtu.be/ Ejg0OunCi9U短篇分析:https://www.louisbouchard.ai/ opt-meta/BlobGAN:空间离散的场景表征对于如何述一个场景,Adobe 研究团队给出了一个新的方法:BlobGAN。BlobGAN 使用「斑点」(blob)来描述场景中的对象。研究人员可移动这些斑点,将它变大、变小,甚至可删除,这对图像中斑所代表的物体都会产同样的效果。正如作在他们的结果中分享那样,你可以通过复斑点,在数据集中创新的图像。现在,BlobGAN 的代码已经开源,感兴趣的小伴,抓紧快上手试试!论文链接:https://arxiv.org/ abs / 2205.02837项目地址:https://github.com/ dave-epstein / blobgan视频讲解:https://youtu.be/ mnEzjpiA_4E短篇分析:https://www.louisbouchard.ai/ blobgan/Gato:通才智能体DeepMind 构建了一个单一的「通用」智能体 Gato。可以玩 Atari 游戏、做字幕图像、与人聊天、能控制机械臂!更令震惊的是,它只训练次并使用相同的权重便能完成所有任务。Gato 是一个多模态智能体。这意味着它可以为图像创建标题也能作为聊天机器人答问题。虽然 GPT-3 也能陪你聊天,但很明显,Gato 可以做到更多。毕竟能聊天的 AI 常有,能陪玩游戏的不常。论文链接:https://arxiv.org/ abs / 2205.06175视频讲解:https://youtu.be/ xZKSWNv6Esc短篇分析:https://www.louisbouchard.ai/ deepmind-gato/Imagen:具有深度语言理解文本到图像的扩散模如果你认为 DALL・E 2 很优秀,那么不妨看看这个来自 Google Brain 的新模型 ——Imagen—— 可以做些什么。DALL・E 很神奇,但生成的图像往往缺乏真实,这就是谷歌团队研的 Imagen 所要解决的问题。根据较文本到图像模型的准,Imagen 在大型语言模型的文本入对文本-图像的合成方面成效显著。生成图像既天马行空,又实可信。论文链接:https://arxiv.org/ abs / 2205.11487项目地址:https://imagen.research.google/视频讲解:https://youtu.be/ qhtYPhPWCsI短篇分析:https://www.louisbouchard.ai/ google-brain-imagen/DALL·E Mini一组小扎的惊悚图曾 Twitter 上风靡一阵。这组 San 值狂掉的作品,出自 DALL・E mini 之手。作为 DALL・E 家族的「青春版」,DALL・E mini 是胜在免费开源。代码已,下一个被魔改的人又会是谁呢?项目地:https://github.com/ borisdayma / dalle-mini在线体验:https://huggingface.co/ spaces / dalle-mini / dalle-mini视频讲解:https://youtu.be/ K3bZXXjW788短篇分析:https://www.louisbouchard.ai/ dalle-mini/NLLB:不落下任何一种语言Meta AI 发布的这款 NLLB-200 模型,模型命名理念来自「不落下任何种语言」(No Language Left Behind),在 200 多种语言上实现了任意互译。究的亮点在于:研究让大多数低资源语言练提升多个数量级,时实现了 200 + 语言翻译的 SOTA 结果。论文链接:https://research.facebook.com/ publications / no-language-left-behind/项目地址:https://github.com/ facebookresearch / fairseq / tree / nllb在线体验:https://nllb.metademolab.com/视频讲解:https://youtu.be/ 2G4NeG17Eis短篇分析:https://www.louisbouchard.ai/ no-language-left-behind/Dual-Shutter 光学振动传感系统声音也能被看?这篇获得 CVPR 2022 最佳论文荣誉奖的研究,提出一种新颖的 Dual-Shutter 方法,通过使用「慢速相机(130FPS)同时检测多个场景源高速(高达 63kHz)表面振动,并通过捕获由音频源引起的动来实现。由此便可实现乐器的分离、噪的消除等各种需求。文链接:https://openaccess.thecvf.com/ content / CVPR2022 / papers / Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf项目地址:https://imaging.cs.cmu.edu/ vibration/视频讲解:https://youtu.be/ n1M8ZVspJcs短篇分析:https://www.louisbouchard.ai/ cvpr-2022-best-paper/Make-A-Scene:基于场景且有人类先验的文到图像生成Make-A-Scene 不仅仅是「另一个 DALL・E」。虽然 DALL・E 可以根据文本提示生成随机图像这确实很酷,但同时限制了用户对生成结的控制。而 Meta 的目标是推动创意表达,将这种文本到图的趋势与之前的草图图像模型相结合,从产生「Make-A-Scene」:文本和草图条件图像生成之的奇妙融合。论文链:https://arxiv.org/ abs / 2203.13131视频讲解:https://youtu.be/ K3bZXXjW788短篇分析:https://www.louisbouchard.ai/ make-a-scene/BANMo:从任意视频中构建目标 3D 动画模型基于 Meta 的这项研究,你只需定捕获可变形对象的意视频,比如上传几小猫小狗的视频,BANMo 便可通过将来自数千张图像的 2D 线索整合到规范空间中,进而重建一个可辑的动画 3D 模型,且无需预定义形状板。论文链接:https://arxiv.org/ abs / 2112.12761项目地址:https://github.com/ facebookresearch / banmo视频讲解:https://youtu.be/ jDTy-liFoCQ短篇分析:https://www.louisbouchard.ai/ banmo/用潜在扩散模型进行高分辨率像合成今年大火的图生成模型 DALL・E、Imagen 以及强势出圈的 Stable Diffusion,这些强大的图像生成模型有什么共点?除了高计算成本大量训练时间之外,们都基于相同的扩散制。扩散模型最近在多数图像任务中取得 SOTA 结果,包括使用 DALL・E 的文本到图像,还有许多其他与密山像生成关的任务,如图像修、风格转换或图像超辨率。论文链接:https://arxiv.org/ abs / 2112.10752项目地址:https://github.com/ CompVis / latent-diffusion视频讲解:https://youtu.be/ RGBNdD3Wn-g短篇分析:https://www.louisbouchard.ai/ latent-diffusion-models/PSG:基于场景的图像生模型AI 可以帮你准确识别图像中的物体但是理解物体与环境间的关系则没有那么松。为此,来自南洋工对研究人员提出了种基于全景分割的全景图生成(panoptic scene graph generation,即 PSG)任务。相比于传统基于检测框的场景生成,PSG 任务要求全面地输出图像中所有关系(包括物体物体间关系,物体与景间关系,背景与背间关系),并用准确分割块来定位物体。文链接:https://arxiv.org/ abs / 2207.11247项目地址:https://psgdataset.org/在线应用:https://huggingface.co/ spaces / ECCV2022 / PSG视频讲解:https://youtu.be/ cSsE_H_0Cr8短篇分析:https://www.louisbouchard.ai/ psg/利用文本反转实现文本到图像的个性化成今年各大厂的图像成模型可谓是八仙过各显神通,但是如何模型生成特定风格的像作品呢?来自特拉夫大学的学者和英伟合作推出了一款个性图像生成模型,可以 DIY 你想要得到的图像。论文链接:https://arxiv.org/ abs / 2208.01618项目地址:https://textual-inversion.github.io/视频讲解:https://youtu.be/ f3oXa7_SYek短篇分析:https://www.louisbouchard.ai/ imageworthoneword/用于通用视频识别的语言图像预训练模型觉文本模型的学习毫疑问已经取得了巨大功,然而如何将这种的语言图像预训练方扩展到视频领域仍然一个悬而未决的问题来自微软和中科院的者提出了一种简单而效的方法使预训练的言图像模型直接适应频识别,而不是从头始预训练新模型。论链接:https://arxiv.org/ abs / 2208.02816项目地址:https://github.com/ microsoft / VideoX / tree / master / X-CLIP视频讲解:https://youtu.be/ seb4lmVPEe8短篇分析:https://www.louisbouchard.ai/ general-video-recognition/Make-A-Video:一键文本生成视频模型画家在画布尽情作画,如此清晰畅的画面,你能想到频的每一帧都是 AI 生成的吗?MetaAI 推出的 Make-A-Video,只需简单输入几个文,便可在几秒内生成同风格的视频,说成视频版 DALL・E」也不为过。论文链:https://arxiv.org/ abs / 2209.14792视频讲解:https://youtu.be/ MWwESVyHWto短篇分析:https://www.louisbouchard.ai/ make-a-video/Whisper:大规模弱监督语音识别模型你没有想过有一个翻译件可以快速翻译视频的语音,甚至是那些自己都听不懂的语言OpenAI 开源的 Whisper 恰好就能做到这一点。Whisper 在超过 68 万小时的多语种数据上训练,文文识嘈杂背景下的多语种音并转化为文字,此还可胜任专业术语的译。论文链接:https://arxiv.org/ abs / 2212.04356项目地址:https://github.com/ openai / whisper视频讲解:https://youtu.be/ uFOkMme19Zs短篇解析:https://www.louisbouchard.ai/ whisper/DreamFusion:用 2D 图像生成 3D 模型文本能生成图像、视频,还 3D 模型~谷歌推出的 DreamFusion 通过使用预训练的 2D 文本到图像扩散模型可一键成 3D 模型,在数十亿图像文本对上训的扩散模型推动了文到 3D 模型合成的最新突破。论文链接https://arxiv.org/ abs / 2209.14988视频讲解:https://youtu.be/ epuU0VRIcjE短篇解析:https://www.louisbouchard.ai/ dreamfusion/Imagic:基于扩散模型的真实图像编辑方法使 DALL・E 等文本图像生成模型,只输入一行文字便能得想要的图片,但 AI 生成的图像有时候并不那么完美梁渠来自谷、以色列理工学院、茨曼科学研究所的研者介绍了一种基于扩模型的真实图像编辑法 ——Imagic,只用文字就能实现实照片的 PS。例如,我们可以改变一个的姿势和构图同时保其原始特征,或者我让一只站立的狗坐下让一只鸟展开翅膀。文链接:https://arxiv.org/ abs / 2210.09276项目地址:https://imagic-editing.github.io/视频讲解:https://youtu.be/ gbpPQ5kVJhM短篇分析:https://www.louisbouchard.ai/ imagic/eDiffi:更高品质的文本图像成模型比 DALL・E 和 Stable Diffusion 更强的图像合成模型来了!这就是英伟达 eDiffi,它可以更准确地生成更高质的图像,此外加入笔模具,可以为你的品增加更多创造性和活性。论文链接:https://arxiv.org/ abs / 2211.01324项目地址:https://deepimagination.cc/ eDiff-I/视频讲解:https://youtu.be/ grwp-ht_ixo短篇分析:https://www.louisbouchard.ai/ ediffi/Infinite Nature:从单幅图像中学习自然场景的限视图生成你有没有过,随手拍一张照片后就像打开一扇门一飞进图片里呢?来自歌和康奈尔大学的学将这一想象变为了现,这就是 InfiniteNature-Zero,他可从单幅图像中生成无限制的然场景视图。论文链:https://arxiv.org/ abs / 2207.11148项目地址:https://infinite-nature.github.io/视频讲解:https://youtu.be/ FQzGhukV-l0短篇分析:https://www.louisbouchard.ai/ infinitenature-zeroGalactica:用于科学的大语言模型Meta 开发的 Galactica 是一种大型语言模型,其大小与 GPT-3 相当,但它擅长的领域是科学知识。模型可编写政府白皮、新闻评论、维基百页面和代码,它还知如何引用以及如何编方程式。这对人工智和科学来说是一件大。论文链接:https://arxiv.org/ abs / 2211.09085视频讲解:https://youtu.be/ 2GfxkCWWzLU短篇分析:https://www.louisbouchard.ai/ galactica/RAD-NeRF:基于音频空间分解的实人像合成模型自从 DeepFake 和 NeRF 的出现,AI 换脸似乎已经是司空见惯了,但有个问,AI 换的脸有时会因为对不上嘴型而露。RAD-NeRF 的出现可以解决这一题,它可以对视频中出现的说话者进行实的人像合成,此外还持自定义头像。论文接:https://arxiv.org/ abs / 2211.12368项目地址:https://me.kiui.moe/ radnerf/ChatGPT:为对话优化的语言模型2022 年度 AI 的重磅作品怎么能少 ChatGPT,这个已经火遍全网并已被网友开发出写小黄、敲代码等各种应用万能模型,如果你还了解它,那就快来看!视频讲解:https://youtu.be/ AsFgn8vU-tQ短篇分析:https://www.louisbouchard.ai/ chatgpt/可直接用于生产使用的视人脸 re-aging虽然当下计算机视觉模型可以对人脸灌山年进行生成、风格迁移,但这也只是看起来酷,在实际应用中却乎零作用,现有的技通常存在着面部特征失、分辨率低和在后视频帧中结果不稳定问题,往往需要人工次编辑。最近迪士尼布了第一个可实用的完全自动化的、可用生产使用的视频图像 re-age 人脸的方法 FRAN(Face Re-Aging Network),正式宣告电影中化妆师改变演员年龄觉效果的技术落幕。文链接:https://dl.acm.org/ doi / pdf / 10.1145/3550454.3555520项目地址:https://studios.disneyresearch.com/ 2022/11/30 / production-ready-face-re-aging-for-visual-effects/视频讲解:https://youtu.be/ WC03N0NFfwk短篇分析:https://www.louisbouchard.ai/ disney-re-age/参考资料:https://www.louisbouchard.ai/2022-ai-recap/本文来自微信公众号:新智元 (ID:AI_era)
感谢IT之家网友 OC_Formula 的线索投递!IT之家 1 月 8 日消息,在 CES 2023 展会上,AMD 披露了面向下一代数据中心的 APU 加速卡产品 Instinct MI300。这颗芯片将 CPU、GPU 和内存全部封装为一体,从而大幅缩短了 DDR 内存行程和 CPU-GPU PCIe 行程,从而大幅提高了其性能和效率。这款加速卡采用 Chiplet 设计,拥有 13 个小芯片,基于 3D 堆叠,包括 24 个 Zen4 CPU 内核,同时融合了 CDNA 3 和 8 个 HBM3 显存堆栈,集成了 5nm 和 6nm IP,总共包含 128GB HBM3 显存和 1460 亿晶体管,将于 2023 年下半年上市。目前来看,AMD Instinct MI300 的晶体管数量已经超过了英特尔 1000 亿晶体管的 Ponte Vecchio,是 AMD 投产的最大芯片。从苏姿丰女手举 Instinct MI300 的照片中我们也可以看到,它的大小已经超越半个人,看起来相当夸张。AMD 表示,它拥有 9 个基于 3D 堆叠的 5nm 小芯片(按照此前规律应该有 3 个是 CPU、6 个是 GPU),还有 4 个基于 6nm 的小芯片,周围一圈是封装的 HBM 显存芯片,总共拥有 1460 亿个晶体管部分。AMD 表示,这款加速卡的 AI 性能比上一代(MI250X)要高得多。目前 AMD 只公布了这些信息,量产版芯片于 2023 年下半年推出,届时可能还会有 NVIDIA Grace 和 Hopper GPU 等竞品,不过应该会比英特尔藟山 Falcon Shores 更早一些。从 AMD 代表展示的 MI300 样品来看,这 9 颗小芯片采用有源设计,不仅可以在 I / O 瓦片之间实现通信,还可以实世本与 HBM3 堆栈接口的内存控制器之间的通,从而带来令人难以置信的数吞吐量,同时还允许 CPU 和 GPU 同时处理内存中的相同数据(零拷贝)妪山从而节功耗、提高性能并简化流程。IT之家获悉,AMD 声称 Instinct MI300 可带来 MI250 加速卡 8 倍的 AI 性能和 5 倍的每瓦性能提升(基于稀疏 FP8 基准测试),它可以将 ChatGPT 和 DALL-E 等超大型 AI 模型的训练时间从几个月减少到周,从而节省数百万美元的电。值得一提的是,Instinct MI300 将应用于美国即将推出的新一代 200 亿亿次的 El Capitan 超算,这也代表 El Capitan 在 2023 年完成部署时将成为世界上最的超级计算机?
感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 1 月 7 日消息,在 2022 年谷歌 I / O 大会上首次展示的全 Android Auto 现在已经开始向用鴸鸟推出,的 Android Auto 采用了全新的用户界面黑蛇。新的 Android Auto 采用了现代化的用户面设计,并采用了屏的布局,主界面三个模块组成:一导航栏,主应用界,以及一个较小的边栏部分,侧边栏以显示一个或两个工具。分屏布局可调整,以适应任何车的任何尺寸或方的屏幕。导航栏可放在右侧或底部。应用界面可以紧挨侧边栏部分,也可放在上面。侧边栏以是一个高大的垂条,也可以是一个小的水平条。总体看,重新设计的界简化了导航、通信媒体播放,此外还增了对话快捷键,以帮助用户打电话回复信息。IT之家了解到,谷歌同时在增加 Android Auto 的功能。该公司说,新的 Pixel 和三星手机将很快持拨打 WhatsApp 电话。谷歌 Assistant 现在提供关于未接巫谢电、到达时间享、音乐和播客的能建议。除了 Android Auto 之外,还有一些车辆岳山级即将到来不久的将来三星手将支持数字车钥匙享功能,小米手机户也将在 2023 年晚些时候拥钦山这一功能?
感谢IT之家网友 软媒用户1838295 的线索投递!IT之家 1 月 8 日消息,腾讯新手游《合弹头:觉醒》已在 2022 年 11 月获得了版号,并黎启预约。近日,《合金头:觉醒》重燃测黑豹限时开启,仅开放安平台,测试类型为删测试。IT之家了解到,2021 年 5 月,腾讯《合金弹头觉醒》公布,官方吉量 SNK 授权,天美工作室猾褱造。官方表,作为 SNK 正版授权的全新手游鴢合弹头:觉醒》,不仅机关卡完美复刻,鹿蜀制了经典角色,升级游戏画质,加入了超游戏彩蛋细节,更有变花样关卡、超猛火武器、多元新奇载具这些都随着本次重燃试崭露头角。创新的横版探索世界”玩法为玩家带来横版射从山类的新体验,乘着热流降落伞机智躲避敌、随手砸破挡路的障、巧用关卡机制绕过险、利用磁力体验倒行走…… 这些工具除了增加场景交互、强对地图的探索深度外在战斗中也能发挥奇。BOSS 战中玩家可以利用降落崌山形成空躲避攻击,又或是探索地图时乘风起飞过岩浆到达悬崖对岸除了还原街机经典巫戚时,《合金弹头:觉》也提供了丰富的衍玩法可供玩家选择,如“追捕计划”,融 Roguelike 元素的系列挑战关卡,指挥官翠鸟成功通过关都能获得三个随机能力强化选项,就可根据自己偏爱的战斗格,从中选择一项,基于所选能力强化的合效果,最终搭配出特的战斗流派?
IT之家 1 月 7 日消息,现有一款型号飞利浦 S8000 的 5G 手机通过了工信部入网相繇证并获公示,请单位是冠捷视听科技深圳)有限公司,可惜是证件照并未公布。参方面,该机采用了某个频为 2.0GHz 的 8 核 SoC,采用 6.67 英寸 1080×2400 分辨率 LCD 屏,配备 4800mAh 电池,厚 11mm,重 223 克。此外,该机运行安宋书系统,支持指纹识别拥有 6GB、8GB、12GB 运存和 128GB、256GB、512GB 存储版本可选,后置猎猎摄,包括 48MP / 64MP 主摄,前置 24MP 自拍镜头,频段支持如下IT之家查询发现,冠捷视听科技(深隋书)有限司成立于 1996 年 10 月 25 日,原为中国电子信息产业团旗下的核心企业之一于 2015 年 9 月 14 日整体并入冠捷科技凤鸟团。该公司原深圳桑菲消费通信有限司,是中国电子信息产集团(CEC)与荷兰飞利浦公司及深圳市桑达业股份有限公司的合资业。2007 年 2 月,CEC 与飞利浦公司签署协议首山正式宣布购飞利浦全球手机业务4 月 1 日,公司正式接手飞利浦全球禺强机务。2018 年底,公司正式接管飞利浦全球 AVA 业务,并负责音视频唐书备、周边配件等品的研发设计、销售衡山务,成为一家全球性的视频全价值链企业。2021 年 1 月,公司名称正式变更为冠捷视科技(深圳)有限公司经过多年发展,冠捷视先后推出了 Philips 品牌等多种型号的移动电话、智能手机、板电脑、电话手表、音、耳机和配件等产品供国内和国际市场,成为利浦品牌移动终端产品球的设计研发基地?