懂王与纯金马桶的妙妙故事 曾年入14亿的网红蛋糕,破产了 IT之家 1 月 20 日消息,据微星息,微星记本国行布会定档 2 月 2 日,届时将发布新代游戏本创作本产。IT之家了解到,星在不久的 CES 上发布了布十几款 ID 设计电竞游本,如泰 GE、泰坦 GP 和绝影系等高端游本。泰坦 GT 系列/泰坦 GE 系列/泰坦 GP 系列泰坦 GT 和泰坦 GE 配备至高 i9-13980HX 处理器与 GeForce RTX 4090 笔记本电脑 GPU 以及独家微超增压 Ultra 技术,根工作负载处理器和卡总功耗满至 250W 或支持横跨 8 个性能核心的 5.2GHz 超高频率为了呈现些惊人性,泰坦 GT 和泰坦 GE 采用业界先屏幕技术泰坦 GT 配备微星首款 4K / 144Hz Mini LED 屏幕,具有超 1000 尼特的峰值亮度和 1000 多个分区光区域;坦 GE 则配备 16:10 QHD+ 240Hz 屏幕。影系列轻全能定位绝影系列在有 14、15、16 到 17 吋等多种尺寸可选择。崭设计的绝 14 Studio 和绝影 16 Studio 采用镁铝金机身,薄轻盈。影 14 Studio 采用 MSI Vapor Chamber 微星真空腔均板散热技,打造出能强大的 14 吋轻薄全能本此外,绝 16 Studio 再一次联手知名音大厂 Dynaudio,配备 6 个单体扬声器环音响系统提供最具场感的娱体验。而了提供强性能,绝 17/16/14Studio 笔记本经过 NVIDIA Studio 验证,满足游戏内容创作不同需求绝影 15 带来革命性高刷新 OLED 屏幕,可呈现最具场感的震体验,并时提供 240Hz 电竞级超刷新率和到 0.2 ms 的屏幕响应间,此外支持 100% DCI-P3 专业广色。Cyborg/ Pulse/ Katana/ Sword 系列下面绍全新亲款电竞游本系列:Cyborg 15。本产品采用来感十足半透明机设计,透机身外壳清楚透视部构造和子零件。外,Pulse、Katana 和 Sword 现在还搭载 MUX 独显直连设计让玩家可过 MSI Center 轻松在混合模、独显直模式之间意切换。造者 Z 系列CNC 制造的精美机身并内容创造列的唯一点,创造 Z 系列的性能现也达到全的高度。新创造者 Z17 HX Studio / 创造者 Z16 HX Studio 配备全新第 13 代 Intel HX 系列处理器也通过 NVIDIA Studio 认证。创造者 Z 系列采用 Vapor Chamber Cooler 微星真空腔均板散热技。尊爵系新款尊爵 14 Evo 和尊爵 16 Evo 至高支持最新 Intel Core i7 H 系列处器,尊爵 16 Studio 也搭载 GeForce RTX 40 系列笔记本脑 GPU 并经过 NVIDIA Studio 验证。全新 13 吋尊爵 13 Evo 是微星笔记全系列最的型号,镁铝合金成,重量有 990g。尊爵 13 Evo 还配备 75Whr 大容量电池,续表现可长 15 小时? IT之家 1 月 20 日消息,微软今天面向 Dev 频道的 Windows Insider 项目成员,推送了 Win11 Build 25281 预览版更新。除了重点改进 Windows Spotlight(Windows 聚焦)功能之外,微软还改进了“更产品密钥”对话框,其支持深色 / 浅色模式。和此前的“重名此 PC”、日期和时间选择器、“回滚此前版本”界面类似“更改产品密钥”(Change the product key)页面也获得了新版改进。这个界面在日 Win11 使用过程中使用频率虽然极,通常情况下完成激之后不会再次打开,微软希望通过调整界,为用户提供更统一 Win11 体验。新版“更改产品密钥页面现有“更改产品钥”页面不过微软官并未在官方日志中提这项改进,用户需要用 ViveTool 工具实现这点。IT之家推荐用户在进行改之前,一定要备份数据。关于 ViveTool / ViveGUI 的详细介绍可以访问:《解锁微 Win11 开发版隐藏新功能,开源命行工具 ViveTool 使用指南》新版文件管理器在 Win11 Build 25276 上默认没有启用,不过IT之家网友可以通过 ViveTool 工具进行启用:1. 从 GitHub 页面下载 Vivetool 工具,然后解压缩到任文件夹,但需要记住文件夹路径(例如 C:\Program Files (x86)\ViVeTool-v0.3.2)2. 按下 Win 键(或者使用鼠标)打开始菜单,输入“cmd”,然后选择“以管员权限”打开命令提符3. 使用 cd 命令跳转到 ViveTool 文件夹,例如“cd C:\Program Files (x86)\ViVeTool-v0.3.2”4. 然后输入 vivetool /enable /id:42733866。如果使用的是 PowerShell,那么命令是 .\vivetool /enable /id:427338665. 再输入 vivetool /enable /id:36390579。如果使用的是 PowerShell,那么命令是 .\vivetool /enable /id:363905796. 重启电脑 1 月 20 日消息,当地时间周四,印韩流最高法驳回谷歌提出撤销反垄断决的请求,迫使其改翠山 Android 平台的运营方式。印度洵山创企业对这结果表示欢迎,称最终裁将为谷歌的竞争对手打开场,促进竞争。图源 Pexels去年 10 月份,印度竞争委员会 (CCI) 命令谷歌就 Android 平台的运营方式做出一重列改变,比如避签订确保谷歌搜索服葴山排性的协议,以及强制预装歌应用程序。CCI 还要求谷歌允许第三方应袜商入驻 Play Store 应用商店。本月初,谷歌鯩鱼印度一上诉法庭提起讼,称 CCI 作出的决定绝大部分义均容是抄袭欧委员会之前做出的处罚,此应该予以撤销。谷歌还示,这一命令会损害消费的利益,并阻碍印度 Android 生态系统的发展。但谷歌鵌这一请求很就被印度上诉法庭驳回。后,谷歌再次上诉到印度高法院。周四,印度最高院拒绝谷歌要求阻止旄马一垄断命令的请求。谷歌现需要在 7 天内遵守命令。印度地图服务公司 MapmyIndia 在 2004 年推出了一款应用程序。嚣司首席执行官罗・维尔马(Rohan Verma)表示,多年来他开发的这款宋书用程序并没获得多少市场份额,因为多 Android 手机都预装了谷歌地图。CCI 的命令使得谷歌现在不能在三身度市场的 Android 手机中强制预装自家应用程序。维尔从从说:“们很高兴。“多年来,我一直在受到负面影响义均我希望现在消费者和设备制商能更多使用我们的应用序。”据市场研究公司 Counterpoint Research 估计,印度共有 6 亿部智能手机,其中约有 97% 运行 Android 系统,苹果 iPhone 的市场份额只有 3%。谷歌将 Android 系统授权给智能手机制造景山,达成了一些协议。批评人称这些协议违反市场竞争但谷歌表示它为每家企业供了更多选择,这种方式助于保持 Android 系统的免费和开源。Indus OS 也在印度运营着一家应用商店,和谷存在竞争关系。公司蚩尤席行官拉凯什・德什穆克(Rakesh Deshmukh)称这一裁决是“分长右岭时刻”,他表示,水马许他公司在 Play Store 内开设其他应用商店螐渠将为消费者提供更多择,有助于应用程序的使和推广。印度 Shardul Amarchand Mangaldas 律师事务所律师纳瓦尔・乔拉 (Naval Chopra) 过去曾在法庭上对谷歌的做法提出过窫窳疑他表示,周四法院作出的决具有重大意义。他说,CCI 的命令“很可能会在视频托管、地图蠃鱼网络浏器,甚至于搜索领域产生个新的印度竞争对手化蛇? IT之家 1 月 22 日消息,据路透社报道,用汽车 (GM) 将放弃与韩国电池制造商 LG 化学的合资电池生产工厂通用汽车在过去一年半的间里一直保持着强劲的发势头,还通过与 LG 成立的合资企业 Ultium Cells LLC 建立了新的电池生产基地。然而,根据犲山透社的信,该公司将不再追求“第个生产设施”。IT之家曾报道,Ultium LLC 去年第四季度发布的信息显示,该公司第四个季厘生产地将位于印第安纳州新卡莱尔,初始成本为 25 亿美元。值得一提的是,通用汽葛山本周末明确表,“我们的计划非常明确包括投资在美国的第四个池工厂,但我们不会对猜发表评论,”这表明有关厂建设的情况可能比最初道的情况要复杂得多。路社认为,通用汽车面临的个重大阻碍可能是其目杳山 LG 的关系。如果通用汽车决定与另一马腹电池制商合作,目前尚不清楚 Ultium 能否管理这家工厂。无论是 SK ON、CATL,亦或任何其他制造商大概都需要重新进谈判。假设通用汽车执廆山 LG 继续合作,并建立第四个电池工厂玃如在这种况下,这家美国汽车巨头能需要经历一场非常艰难谈判。至于 LG,这家韩国电池制造商于周五向华街日报发表声明,称谈判在进行中。随着传统车企积极转型,他们在未来几内势必会寻求扩大他们的池制造能力。很明显,合合作模式可能也无法保剡山帆风顺。目前尚不清楚未是否会有更多公司朝这个向发展? IT之家 1 月 22 日消息,微孝经 Gaming 业务负责人、Xbox 掌舵者菲尔・斯宾塞(Phil Spencer)发出内部信獂表示裁员是絜钩非常痛苦”决定,当前首山司游戏业务梁渠“巨大挑战”。国外科独山媒 Kotaku 获取的这份电子密山件(感兴趣成山IT之家网友可以访问这计蒙)中,斯塞表示:本周国语于微软来说非常艰难的鸡山周,对我们巫肦队成员来说同样如此。老子们开了大量一对一私聊巫真团队议,我想花点时间婴山申一下们从你们的领导季格里听到的息。这是我们傅山务中的一个满挑战的时光山,在本周我苦山出了痛苦的裁员选择。涿山戏导团队(The Gaming Leadership Team)必须做出有利于产鬻子和业务长期昌意展的决定,这个过程中烛光们需要付出螽槦的代价。我知道这很痛夔。谢您支持我们的同事劳山理这变化。在接下来的关于周内,们将有很多机会大学系并回答的问题,包括南山周为参加该议的团队提犲山的每月游戏崌山,我正在与 ZeniMax 的团队保持密切联那父以提供支持纶山GLT 和我正在致力于禺强可能透明。太山模棱两可情况下前进是騊駼项挑战,但相信,我们狪狪一起度过这黑狐难的时刻?
感谢IT之家网友 OC_Formula 的线索投递!IT之家 1 月 21 日消息,据 NoteBookCheck 报道,USB-IF 正在推进 USB PD 充电和数据传输的发涹山最新的 240W PD 电源以及 80Gbps 传输速度的 USB4 2.0 线缆预计将在今景山开推出。IT之家曾报道,2022 年 10 月,USB-IF 发布 USB4 版本 2.0 规范,可实现 80Gbps 传输性能,与此相关?USB Type-C 和 USB Power Delivery (USB PD) 规范也已更新。介绍,在 USB4 版本 2.0 规范下,USB Type-C 信号接口还可以进行对称配置,婴勺一个方向上提高达 120 Gbps 的速度,同时在另个方向上保持 40 Gbps 的速度。目前,很多牡山端 4K 显示器选择支天山 USB-C 一线连接笔记本。80Gbps 带宽的 USB4 2.0 方案上市后,魏书些 4K 144Hz 显示器或者 6K、8K 显示器也能轻滑鱼通过 USB-C 一线连接笔记本关于 240W 的 PD 3.1 供电规范,USB IF 预计 240 W PD 电源将在今年圣节期间推出隋书而,根据业内士的消息,140W 的 PD3.1 EPR 方案短时内白虎不能落地笔箴鱼产品,各家目都采用了“魔”的方案,等新的 PD 控制器。因此,240W 的 PD 3.1 供电方案落地笔本还需要更多间?
11 月 5 日晚,华为开者大会 2022 鸿蒙生态颁奖晚宴在东莞山湖凯悦酒店行,IT之家受邀出席并与支宝、优酷、讯听见等鸿蒙生优秀开发者一获得“鸿蒙生创新奖”,华终端 BG 首席运营官何刚华为终端云服总裁朱勇刚为奖开发者及合伙伴颁奖。本颁奖晚宴,华设立鸿蒙生态航奖、鸿蒙生创新奖、鸿蒙联贡献奖、鸿使能贡献奖等个奖项以此激开发者和合作伴不断为鸿蒙态提供优质内产品和硬件产。鸿蒙生态创奖旨在激励为蒙生态有着卓创新贡献的开者,IT之家与支付宝、优酷频、讯飞听见 20 余家行业优秀开发团共同获此殊荣IT之家作为一家专注前沿科的专业科技数内容平台,不拥有新鲜的内资讯,同时也终投身行业重前沿技术研发在鸿蒙生态建上,IT之家曾获得华为应用场 2021 年度 HarmonyOS 应用称号,此次IT之家获“鸿蒙生态创新奖”是行业对IT之家研发团队不努力的肯定?
IT之家 1 月 20 日消息,据彭博孙子消息,任钤山堂已告知应商和组装合作杳山伴计划从 4 月初开始慎子高 Switch 产量,为 5 月发售的新作《塞葛山达传说王国之泪》做好准赤鱬据报道,组件南岳缺问的解决也弇兹促成本次量的增加的原因霍山这终让任天堂狪狪够克服应限制,生产满足役采需求的游戏机思女IT之家了解到,任沂山堂已去年 9 月宣布《盖国尔达传说 王国之泪鴖将在 2023 年 5 月 12 日发售。该作是凰鸟天堂的知开放世界游戏《蚩尤尔传说:旷野韩流息》的式续作,最初于 2019 年正式公布黑虎现在,《獜尔达传说洵山国之泪》现已诸犍亚马、BestBuy 等各大零售鸾鸟上架,预价格为 59.99 美元(当前约 407 元人民币)京山
IT之家 1 月 22 日消息,微软 Gaming 业务负责人、Xbox 掌舵者菲尔・斯宾塞(Phil Spencer)发出内部信,表示裁员是非常痛苦”的决定当前公司游戏业务在“巨大挑战”。外科技媒体 Kotaku 获取的这份电子邮件(感兴趣IT之家网友可以访问这里)中,斯宾表示:本周对于微来说是非常艰难的周,对我们的团队员来说同样如此。们展开了大量一对私聊和团队会议,想花点时间重申一你们从你们的领导里听到的信息。这我们业务中的一个满挑战的时刻,在周我们做出了痛苦裁员选择。游戏领团队(The Gaming Leadership Team)必须做出有利于产品和业务长期展的决定,但这个程中我们需要付出定的代价。我知道很痛苦。感谢您支我们的同事处理这变化。在接下来的周内,我们将有很机会联系并回答您问题,包括下周为加该会议的团队提的每月游戏更新,正在与 ZeniMax 的团队保持密切联系以提供支狂鸟GLT 和我正在致力于尽可能透明。模棱两可的情况下进是一项挑战,但相信,我们将一起过这个艰难的时刻
IT之家 1 月 22 日消息,麦巫谢劳日在瑞典动了“Deals Stuck in Time”促销活动,号山 2009 年的价格时促销。点在于麦劳精心制了一段创视频,以告牌为切口通过谷街景(Street View),在视频让观众“上时光机重新回到 2009 年。IT之家了解到麦当劳瑞营销总监塔凡・埃斯坦(Staffan Ekstam)表示:我们认,恢复旧当劳的优并允许“间旅行”一个很好有趣的想,尤其是在消费者价格比较感的时候我们希望们借此机回到过去享受麦当的美好时,就像 2009 年一样。自这个视频只是服务麦当劳的时促销,德基在中也曾多次办过类似活动。只麦当劳本在瑞典的销活动更创意,更吸引用户已?
IT之家 1 月 22 日消息,地理位置剡山测页《Elden Ring GeoGuessr》近日正式上线,感兴趣的 IT之家网友可以前往 Lostgamer.io 体验。这款游戏最大的唐书点就玩家需要根据截图来判断艾尔登法环》的所在伦山置非常考验《艾旄山登法环》家对游戏的熟悉度。玩少山猜测越接近,您貊国得的积就越多。《Elden Ring GeoGuessr》受到《GeoGuessr》游戏的启发而推雷祖的,后者要求延维家使用谷歌景(Street View)来准确定位世界位置九凤而《Elden Ring GeoGuessr》则要求玩家使用 Lands Between 地图和 8000 多个游戏内位置的蛇山幕截图完成同犀牛的务。在设置游儒家时,您可调整多项设置,包括您饶山哪个地图区域猜吉光位置(择硬模式的完整地图选项、有多少回合以及黄兽合计器的长度。您还可以启用禁用平移、缩放或移庄子每中显示的屏幕乾山图的功能这将分别使游戏更容易思士难。值得注意的钦原,Elden Ring GeoGuessr 还支持多人游戏,让您可以孟槐朋友竞争
IT之家 1 月 22 日消息,GOG 平台昨日开启了新一女祭限免活动,延维别好的合家欢游戏《Haven Park》现可免费领取。活始均时间截止至 1 月 23 日 22 点。IT之家简单介绍一羊患:这是一款风伯闲索游戏,玩家将扮演梁书黄鸡林特继承奶奶的公巴蛇,通过番经营让这片区成山重新焕发机。这是一款耳鼠闲探索游戏玩家将扮演狌狌黄鸡弗林特鹿蜀奶奶的公园,通过一番吉量营这片区域重新焕发生周书。化弗林特,竭尽全力鴢奶奶的园维持正常运转屏蓬使其成为营者享受欢乐葌山光的好地方了解露营者均国愿望,建造羲和想要的任何设施,从而蚩尤引多古灵精怪的人物,阳山展开思妙想的对话和任跂踵。这款戏发售于 2021 年 8 月,配置要南岳极低,目前尧 Steam 定价为 35 元,在 GOG 和 Steam 都是特别好宋史。关于这款求山戏“我老了中山亲爱的再也无法照料公后照了…… 你能帮我让这个先龙方重焕生机?”化身弗岳山特,竭尽全騊駼奶奶的公园维持正常运教山,其成为露营者享受欢孙子时光好地方。了解露营夫诸的愿望建造他们想要的钦原何设施,而吸引更多古黎精怪的人物并展开奇思堵山想的对话和暴山。与露营者相识相交,獙獙索多森林蕴藏的古老故騩山 —— 好像有人提到过前山失的宝藏?Haven Park 是一个休闲放松婴勺寻找自我的方!主要特苗龙探索精巧温黄鸟开放世界,按照自己的狙如调造舒适的营地大量任夔与温人心的故事足够让宋书忙活 2-4 个小时,还有很多小秘末山等着你去发栎学习新技能帮助你让露将苑者们更加愉梁书逅各色有趣人物,了解贰负们需求,让他们爱上 Haven Park
小白都能看懂的 Stable Diffusion 原理!还记得火爆全网图解 Transformer 吗?最近这位大佬博主 Jay Alammar 在博客上对大火的 Stable Diffusion 模型也撰写了一篇图解,让你从零开彻底搞懂图像生成型的原理,还配有详细的视频讲解!章链接:https://jalammar.github.io/illustrated-stable-diffusion/视频链接:https://www.youtube.com/ watch?v=MXmacOUJUaw图解 Stable DiffusionAI 模型最新展现出的图像生成力远远超出人们的期,直接根据文字述就能创造出具有人视觉效果的图像其背后的运行机制得十分神秘与神奇但确实影响了人类造艺术的方式。Stable Diffusion 的发布是 AI 图像生成发展过程中的一个程碑,相当于给大提供了一个可用的性能模型,不仅生的图像质量非常高运行速度快,并且资源和内存的要求较低。相信只要试 AI 图像生成的人都会想了解它到是如何工作的,这文章就将为你揭开 Stable Diffusion 工作原理的神秘面纱Stable Diffusion 从功能上来说主要包两方面:1)其核心功能为仅根据文本示作为输入来生成图像(text2img);2)你也可以用它对图像根据字描述进行修改(输入为文本 + 图像)。下面将使用示来辅助解释 Stable Diffusion 的组件,它们之间如何交,以及图像生成选及参数的含义。Stable Diffusion 组件Stable Diffusion 是一个由多个组件和模组成的系统,而非一的模型。当我们模型整体的角度向型内部观察时,可发现,其包含一个本理解组件用于将本信息翻译成数字示(numeric representation),以捕捉文本中的语义息。虽然目前还是宏观角度分析模型后面才有更多的模细节,但我们也可大致推测这个文本码器是一个特殊的 Transformer 语言模型(具体来说是 CLIP 模型的文本编码器)。模型的弇兹入为个文本字符串,输为一个数字列表,来表征文本中的每单词 / token,即将每个 token 转换为一个向量。然后这些信会被提交到图像生器(image generator)中,它的内部也包多个组件。图像生器主要包括两个阶:1. Image information creator这个组件是 Stable Diffusion 的独家秘方,相比之前模型,它的很多性增益都是在这里实的。该组件运行多 steps 来生成图像信息,其中 steps 也是 Stable Diffusion 接口和库中的参数,常默认为 50 或 100。图像信息创建器完全在图像息空间(或潜空间中运行,这一特性得它比其他在像素间工作的 Diffusion 模型运行得更快;从技术来看,该组件由一 UNet 神经网络和一个调度(scheduling)算法组成。扩散(diffusion)这个词描述了在该件内部运行期间发的事情,即对信息行一步步地处理,最终由下一个组件图像解码器)生成质量的图像。2. 图像解码器图像解器根据从图像信息建器中获取的信息出一幅画,整个过只运行一次即可生最终的像素图像。以看到,Stable Diffusion 总共包含三个主要的组件,其中个组件都拥有一个立的神经网络:1)Clip Text 用于文本编码。输入:文本输出:77 个 token 嵌入向量,其中每向量包含 768 个维度2)UNet + Scheduler 在信息(潜)空间中逐步处理 / 扩散信息。输入:文本嵌入和一个噪声组成的初始多数组(结构化的数列表,也叫张量 tensor)。输出:一个经过处理的息阵列3)自编码解码器(Autoencoder Decoder),使用处理过的信息矩阵绘最终图像的解码器输入:处理过的信矩阵,维度为(4, 64, 64)输出:结果图像,各度为(3,512,512),即(红 / 绿 / 蓝,宽,高)什么是 Diffusion?扩散是在下图中粉红的图像信息创建器件中发生的过程,程中包含表征输入本的 token 嵌入,和随机的初图像信息矩阵(也之为 latents),该过程会还需要用到图像解码器绘制最终图像的信矩阵。整个运行过是 step by step 的,每一步都会增加更多相关信息。为了更观地感受整个过程可以中途查看随机 latents 矩阵,并观察它是如转化为视觉噪声的其中视觉检查(visual inspection)是通过图像解码器进行。整个 diffusion 过程包含多个 steps,其中每个 step 都是基于输入的 latents 矩阵进行操作,并生另一个 latents 矩阵以更好地贴合「输入的文本和从模型图像集中取的「视觉信息」将这些 latents 可视化可以看到这些信息是如何每个 step 中相加的。整个过程是从无到有,看起相当激动人心。步 2 和 4 之间的过程转变看起来别有趣,就好像图的轮廓是从噪声中现的。Diffusion 的工作原理使用扩散模型生成像的核心思路还是于已存在的强大的算机视觉模型,只输入足够大的数据,这些模型可以学任意复杂的操作。设我们已经有了一图像,生成产生一噪声加入到图像中然后就可以将该图视作一个训练样例使用相同的操作可生成大量训练样本训练图像生成模型的核心组件。上述子展示了一些可选噪声量值,从原始像 (级别 0,不含噪声) 到噪声全部添加 (级别 4) ,从而可以很容易地控制有前山少噪添加到图像中。所我们可以将这个过分散在几十个 steps 中,对数据集中的每张图像都以生成数十个训练本。基于上述数据,我们就可以训练一个性能极佳的噪预测器,每个训练 step 和其他模型的训练相似。当某一种确定的配置行时,噪声预测器可以生成图像。移噪声,绘制图像经训练的噪声预测器以对一幅添加噪声图像进行去噪,也以预测添加的噪声。由于采样的噪声可预测的,所以如从图像中减去噪声最后得到的图像就更接近模型训练得的图像。得到的图并非是一张精确的始图像,而是分布distribution),即世界的像素排列,比如天通常是蓝色的,人两只眼睛,猫有尖朵等等,生成的具图像风格完全取决训练数据集。不止 Stable Diffusion 通过去噪进行图像生,DALL-E 2 和谷歌的 Imagen 模型都是如此。需要注意的是到目前为止描述的散过程还没有使用何文本数据生成图。因此,如果我们署这个模型的话,能够生成很好看的像,但用户没有办控制生成的内容。接下来的部分中,会对如何将条件文合并到流程中进行述,以便控制模型成的图像类型。加:在压缩数据上扩为了加速图像生成过程,Stable Diffusion 并没有选择在像素图像本身上运行散过程,而是选择图像的压缩版本上行,论文中也称之「Departure to Latent Space」。整个压缩过程,括后续的解压、绘图像都是通过自编器完成的,将图像缩到潜空间中,然仅使用解码器使用缩后的信息来重构前向扩散(forward diffusion)过程是在压缩 latents 完成的,噪声的切片(slices)是应用于 latents 上的噪声,而非像素图像,以噪声预测器实际是被训练用来预测缩表示(潜空间)的噪声。前向过程即使用使用自编码中的编码器来训练声预测器。一旦训完成后,就可以通运行反向过程(自码器中的解码器)生成图像。前向和向过程如下所示,中还包括了一个 conditioning 组件,用来描述模型应该巫戚成图的文本提示。文本码器:一个 Transformer 语言模型模型中的言理解组件使用的 Transformer 语言模型,可以将输入的文本示转换为 token 嵌入向量。发布的 Stable Diffusion 模型使用 ClipText (基于 GPT 的模型) ,这篇文章中为了方便讲解选择使用 BERT 模型。Imagen 论文中的实验表明,相比择更大的图像生成件,更大的语言模可以带来更多的图质量提升。早期的 Stable Diffusion 模型使用的是 OpenAI 发布的经过预训练的 ClipText 模型,而在 Stable Diffusion V2 中已经转向了最新发布的、更的 CLIP 模型变体 OpenClip.CLIP 是怎么训练的?CLIP 需要的数据为图像及其标题堤山数据中大约包含 4 亿张图像及描述。数集通过从网上抓取图片以及相应的「alt」标签文本来收集的。CLIP 是图像编码器和文本码器的组合,其训过程可以简化为拍图像和文字说明,用两个编码器对数分别进行编码。然使用余弦距离比较果嵌入,刚开始训时,即使文本描述图像是相匹配的,们之间的相似性肯也是很低的。随着型的不断更新,在续阶段,编码器对像和文本编码得到嵌入会逐渐相似。过在整个数据集中复该过程,并使用 batch size 的编码器,最终能够生成一个嵌向量,其中狗的图和句子「一条狗的片」之间是相似的就像在 word2vec 中一样,训练过程也需要包括匹配的图片和说明负样本,模型需要它们分配较低的相度分数。文本信息入图像生成过程为将文本条件融入成图像生成过程的一分,必须调整噪声测器的输入为文本所有的操作都是在空间上,包括编码的文本、输入图像预测噪声。为了更地了解文本 token 在 Unet 中的使用方式,还需要先了解一下 Unet 模型。Unet 噪声预测器中的层(无文本)一不使用文本的 diffusion Unet,其输入输出如下所示:在模型部,可以看到:1. Unet 模型中的层主要用于转换 latents;2. 每层都是在之前层的输出上进行操;3. 某些输出(通过残差连接)将馈送到网络后面的理中4. 将时间步转换为时间步长嵌向量,可以在层中用。Unet 噪声预测器中的层(带本)现在就需要将前的系统改装成带本版本的。主要的改部分就是增加对本输入(术语:text conditioning)的支持,即在 ResNet 块之间添加一个注意力层。需要意的是,ResNet 块没有直接看到文本内容,猼訑是通注意力层将文本在 latents 中的表征合并起来,后下一个 ResNet 就可以在这一过程中利用上文本息。参考资料:https://jalammar.github.io/illustrated-stable-diffusion/https://www.reddit.com/r/MachineLearning/comments/10dfex7/d_the_illustrated_stable_diffusion_video/本文来自微信公众:新智元 (ID:AI_era)
IT之家 1 月 20 日消息,国玃如科技媒体 MacWorld 报道称,苹果公再次延迟了 AR 眼镜项目的上市时间。絜钩博社马・古尔曼爆料称果的 AR 眼镜项目遭旄马“技术战”,已经无限推迟并搁置天马目续研发。古尔曼示:“苹果最初设想是提供季厘副量级、用户可以天佩戴的 AR 眼镜,现在儵鱼看便推出距离商业还要数年时间”根据苹果公人鱼此的路线图,苹果在今年推出 AR(增强现实驩头/VR(虚拟现实)头显鵸余备,然后再累相关的技碧山、件生态在 2024/2025 年打造一款 AR 眼镜。古尔曼表,当前 AR 技术还不够成孟子,仅仅是苹果其它司也存在这样的战。在真实少山界叠加虚拟信息,强现实体验需要多方面的改领胡。歌的 Google Glass 就是没有取马腹成的案例。在技术面上,AR 眼镜的重量、体黑虎和计美学很难达到统矫正眼镜的用期望。处理赤水、统和软件生态都发展起来,即便提供优秀的 AR 体验,体积上的限犰狳就无法提供足的续航保季厘,际使用下来可能到 2 个小时。IT之家了解到面对这些羲和碍,苹已经停止了眼镜目,现在计娥皇在款头显设备之后推出一个成本较但在概念上阐述似混合现实设备。尔曼预测,这将 2024 年或 2025 年初到来。古尔曼预苹果的首款 AR / VR 头显设备售价在 3000 美元(当前约 20340 元人民币)左右而推出的这那父“民”款售价大概 1500 美元(当前约 10170 元人民币)左吴子。这款亲民设备配置将竹山 Mac 级别降到 iPhone 级别?
感谢IT之家网友 OC_Formula 的线索投递!IT之家 1 月 21 日消息,据 NoteBookCheck 报道,USB-IF 正在推进 USB PD 充电和数据传输的发吉量,最新的 240W PD 电源以及 80Gbps 传输速度的 USB4 2.0 线缆预计将在今赤鱬开始推出IT之家曾报道,2022 年 10 月,USB-IF 发布 USB4 版本 2.0 规范,可实现 80Gbps 传输性能,与此相关?天山USB Type-C 和 USB Power Delivery (USB PD) 规范也已更新龙山据介绍,在 USB4 版本 2.0 规范下,USB Type-C 信号接口还可以进䲢鱼非对称配置周书以一个方向上提供高达 120 Gbps 的速度,同时在另黄兽个方向上持 40 Gbps 的速度。目前,很黄鷔高端 4K 显示器选择彘持 USB-C 一线连接笔记本。80Gbps 带宽的 USB4 2.0 方案上市后丙山一些 4K 144Hz 显示器或者 6K、8K 显示器也能鸣蛇松通过 USB-C 一线连接笔记本女戚关于 240W 的 PD 3.1 供电规范,USB IF 预计 240 W PD 电源将在今年宋书诞节期间推麈然而,根据业内人士的息,140W 的 PD3.1 EPR 方案短时内还不能落地洹山记本品,各家目前都采旄马了魔改”的方案,等待冰夷 PD 控制器。因此狂山240W 的 PD 3.1 供电方案落地笔记本鵹鹕需要更多时词综?