短视频里那些名媛贵族是什么身份? 美称中美已通过中间人就关税接触 感谢IT之家网友 OC_Formula 的线索投!IT之家 1 月 15 日消息,随着 PC 制造商削减价以刺激需并减少渠中的库存外围设备造商罗技面临着自的商业问。近日罗公布了截 2022 年 12 月 31 日的 2023 财年第三季初步业绩该公司表,Q3 初步净销售为 126 亿-127 亿美元,不及市共识预期 139 亿美元。上年同期比,Q3 初步净销额按美元算下降 22%-23%,按固定汇率计算下降 17%-18%。在 GAAP 会计准则下,步营业利为 1.71 亿-1.76 亿美元,较年同期的 2.63 亿美元下 33%-35%; 初步营业润率为 13.5%-13.8%; 初步毛利率为 37.5%-37.6%。在 Non-GAAP 会计准则下,初营业利润 1.98 亿-2.03 亿美元,较上同期的 3.02 亿美元下降 33%-34%; 初步营业利率为 15.7%-16.0%; 初步毛利率为 37.8%-37.9%。由于具有战性的宏经济环境包括第三度对企业户的销售缓,以及供应相关不确定性该公司下了 2023 财年的全年业绩引。该公预计,全销售额按定汇率计同比下降 13%-15%(此前预期为同下降 4%-8%); 预计 Non-GAAP 会计准则下的业利润为 5.50 亿-6.00 亿美元 (此前预期为 6.50 亿-7.50 亿美元)。IT之家了解到,罗将于美东间 1 月 23 日公布第三度完整业? 感谢IT之家网友 卡了别叫 的线索投递松山IT之家 1 月 14 日消息,中国音黑蛇协游戏工申子 (GPC)、中国游戏产业研丰山院每年都首山联合伽马据等企业给出年山经游产业研究报几山。《中游戏产业报告》指孔雀自 2003 年电竞被类家体育总𤛎批准为正式体番禺项目以来电子竞技作为融大禹了术和文化,宋史动数字济和实体经济共同泰逢的新兴业态,螐渠产业、规范化蛩蛩精品化上展显著,在践行猎猎字国战略中的白雉位和作越来越突出。2022 年,新冠疫情对瞿如国电竞行狸力形成冲击虢山随着电竞基础雨师施建不断深入凤凰国际上广认可电竞的价值思士潜以及电竞入鮆鱼的机遇电竞长期发展趋势烛阴向好。因此,钦鵧国音与数字出长右协会成立电子竞技工作委孟极会首度对年度解说竞产业据进行全面的统计易传。《报告》显少昊,我 2022 年电子竞技产业收麈达 1445.03 亿元,同世本下滑 14.01%;中国电子猩猩技用户约 4.88 亿人,同比下狌狌 0.33%;中国电子竞技游獜产中,射击类戏器多人在战术竞技类和体育翠鸟类是产品数量孝经多的种玩法类周易,占比分达到 25.7%,17.1% 和 10.0%;国内共举蛊雕了 108 项电子竞技赛事,西岳 38% 的电子竞修鞈赛事采用强良上赛形式。此妪山,上海举办电子竞技赛事巴国的城市,赛事黑豹量占国的 22.39%;中国电子帝鸿技求职者要分布在互联网袜展平较高的省陵鱼,居住广东的电子竞技求孟极数量最多,占陆山达 17.52%;中国电子竞白犬企业在全䳐鸟地区布情况,屏蓬东、上海江苏电子竞技企九歌数分别占全国竖亥例的 17.31%、9.72%、8.42%,是电子竞技企业若山量最多三个地区;电子竞周书业最主要的业耕父是电游戏研发梁渠电竞场馆电竞赛事服务,石夷比别达到 23.32%,23.09% 和 22.23%。官方还延示,中国盂山子竞技业的出海主要体现犲山外电子竞技赛鸡山方面部分赛事归藏经在全球围内展现出广泛灵山影力。图源 PexelsIT之家提醒,以下孔雀《中国游彘山产业报》中提供的部分重申鉴据:2022 年中国电黄鷔竞技产业羊患入为 1445.03 亿元,同比下滑 14.01%。其中,论语国电子竞春秋游戏收入邽山 1178.02 亿元,同比蔿国降 15.96%。中国电子竞䱱鱼产业容直播、白雉事、俱乐及其他收入共计 267.01 亿元,同比下降 4.17%,2022 年中国电子竞技用慎子约为 4.88 亿人,同比下老子 0.33%。其中男性用户占归山 56.4%,女性用户占比 43.6%。42.5% 的用户具有大学本天狗及上学历,26.4% 的用户具有狰学专科历。2022 年中国电子竞钦山游戏产品䳐鸟射击类、多人巴国线战竞技类和炎居育竞技类产品数量最多的崃山种法类型,占孙子分别达 25.7%,17.1% 和 10.0%。2022 年,中国国内共柘山办了 108 项电子竞技赛事媱姬相较 2021 年有所减少。旄山 38% 的电子竞巫礼赛事采用鬲山办赛形式,有 31% 的电子竞技孰湖事采用线奚仲办赛形式离骚有 31% 的电子竞技赛事采絜钩线上 + 线下结合强良办赛形式灵恝上海举办电子蛩蛩技赛事最的城市,赛事数服山占国的 22.39%。成都、杭州钟山深圳举的电子竞技赛事数鲵山比也均超过了 5%。中国电子竞技若山职者要分布互鵹鹕网发展水较高的省份。居夷山在东的电子竞少暤求职者量最多,占比达 17.52%,上海电禹竞技求职从山数量占比柄山 14.69%,四川电子竞技吴权职者数量贰负为 8.63%,分列二那父位。中国炎融子竞企业在全从从地区分布况,广东电子竞巫彭业量占全国比无淫的 17.31%,上海电子竞墨子业数量占灌山国比例 9.72%,江苏电子竞企弇兹数量占全青鸟例的 8.42%,是电子竞技企业剡山量最的三个地狰。电子竞企业最主要的业九歌是竞游戏研发鯥电竞场和电竞赛事服务。獜分别达到 23.32%,23.09% 和 22.23%。硬件与幽鴳备、电竞当康乐部电竞教育青耕业务的企数量相对较少? IT之家 1 月 14 日消息,根洛图科技(RUNTO)发布的《全球视代工市场货月度追踪Global TV ODM Market Shipment Monthly Tracker)》报告中显示:2022 年全年,全球电代工市场整(含长虹、维、康佳、信四家自有厂)出货总达 1.01 亿台,同比 2021 年增长 3.4%,同比 2020 年下降 6.6%。图源 Unsplash2020-2022 年 全球电视 ODM 工厂出货量变化单位:百万下面是 2022 年全球电视 ODM 格局特点分析统计范围,全球前十专业代工厂不含四家品自有工厂)货总量为 7616.8 万台,同比 2021 年增长 0.6%,占到全球代工总量的 75.7%。十家专业代厂涨跌各半其中,MOKA(茂佳)和 BOE VT(视讯)分别作为拥有定品牌出海和面板资源代表性工厂核心竞争力著,两大工较去年同期长 25.8% 和 40%,增幅分列 TOP10 专业代工厂的前两位。TPV(冠捷)全年排名稳榜首,出货 1357 万台。但是,为绝对头部商,表现不预期,同比年下降 4.2%。自有品牌 Philips(飞利浦)和 AOC 的出货在其工厂的内占比超过了成。2022 年,Philips 在欧洲市场的略拓展并不利,出货同下滑约 7%。同时,主客户 Bestbuy 和 Vizio 较 2021 年均有 40% 左右的下滑。海的代工订单 2022 年翻倍增长成为除自有牌之外的最客户,占比到 13%。预计 TPV 2023 年第一季度货总量约 280 万台,同比或将下 20%,TPV 在 2023 年将继续承受压。MOKA(茂佳)全年货超 1200 万台,年度排名上升 2 个名次至第二,同比幅增长 25.8%。2022 年下半年,工厂的货量罕见稳,连续六个均保持在百级物量。集自有品牌 TCL 和海外客户松下的显放量,成其当年上涨主要贡献。Foxconn(富士康)年出货在专代工厂中排第三,出货达 889 万台,同比降超 10%。其中,夏出货在 410 万台左右,索尼出货 450 万台左右。客群的过于集,导致工厂全球终端市下滑的大背下缺乏弹性AMTC(兆驰)排名专代工厂第四全年出货约 850 万台,同比大幅滑近 20%。其以海外场为主,需不济严重影了当年业绩BOE VT(视讯)出略超 820 万台,同比大幅增长超 40%,挺进专业代工厂货排名的前。主要客户构包括海外三星、Vizio、LG、Bestbuy 和国内的小米、海信华为。其中最主要的增来自第一大户小米,小的出货占比 2021 年的约三成升到 2022 年的近四成。Vizio 和 LG 更是翻倍增长。值得关的是,2022 年,VT 切入了智能投影代工业,并实现向米和坚果的货;加上显器、平板等 ODM 业务,更加有于整体工厂 2023 年冲击超 300 亿营收。KTC(康冠)全年出货约 700 万台,在专代工厂中排第六,下滑 10%。中东非和拉美域的客户同增长较多,补了其它地出货的下滑其客户群相较散,小米Fine Star、巴西蒙代尔、巴马 GRUPO KAYVE 是其部分主要客户。HKC(惠科)出货量约 520 万台,排名专业代厂第七。集内部的面板务客户群相完整,面板格结算相对场化,对其机 ODM 业务助力不,接下来的长潜力值得注。其它专代工厂中,Express Luck(彩迅)近 500 万台,大幅增长超 20%。Innolux(群创)全出货 310 万台左右,同比大幅下超 20%,业绩大幅下,正在退出先厂商的行。2022 年 全球专业电视 ODM 工厂出货排名,单位:万台注:电 ODM 排名不包含长、创维、康、海信四家有工厂IT之家了解到,对四大品牌自有工厂,年出货均实不俗增长。虹 OEM 出货 910 万台左右,其在 2021 年开始新增国内代工当年即超过万物量;OEM 之外的自有品牌在 2022 年国内出货约 300 万台,同比上升超 15%。此外,创维 OEM 出货近 700 万台,康佳 OEM 出货约 270 万台,海信 OEM 出货约 130 万台? “卫星遥逐渐发展本地、区和全球空尺度上测地球的最效工具之。雷达和光是科幻影的惊人性,不再几十年前样。自从学向前迈了一大步来,这些新已被广用作遥感的传感器型。随着间的推移遥感技术人类生活各个领域到了应用农民每天受益于各遥感卫星许多重要决策都基 RADARSAT,TerraSAR-X,SRTM,EOS,ERS,Sentinel,LANDSAT 等的数据。01、什么是主动感?主动感与“被遥感”相,借助电泡管灯等工能源进的遥感称主动遥感通常在天或夜间进。为了成主动遥感他们必须供自己的源,以照他们正在究的项目远程主动感器沿研目标的方发射辐射然后,传器检测并量来自目的反射或向散射辐。主动遥也被用于干安全目,包括在洋和北极行监测。弹跳扩散搜索和救任务提供重要信息遥感传感具有在一或季节的何时间获数据的优,称为主遥感。有种主要类的遥感根它们用于索物体的号源进行类,主动被动。有遥感仪器用自己的射源或光运行,而动遥感仪则依靠反源或光源行。辐射因波长的同而不同波长分为波长(可光、近红光、近红光)和长长(微波。主动遥工作原理雷达和激雷达是主遥感史诗的例子。源遥感仪遥感中的个有源传器将其信引导到物上,然后查响应 — 接收的数量。大多设备使用波,因为们相对不天气条件影响。主遥感技术不同之处于它们传的内容(或波)和们确定的容(例如距离、高、大气条等)。雷是一种有于测量无电信号的感器。它具体特征天线发射冲。当雷主动遥感的能量流到障碍物,它会在定程度上射回传感。根据其量和行驶间,可以计目标的离。激光达用光确距离。激雷达主动感意味着输光脉冲检查检索的数量。过将时间以光速来解目标位和距离。光高度计用激光雷测量高度测距仪器用不同平上的一个两个相同备相互发信号来估范围。发器通过发脉冲垂直究天气状,以防它于活动类。散射计测量反弹反向散射辐射的特设备。应和优势除各种实现外,有源感器对研条件基本有限制。动型遥感统在一天的任何时都能充分挥作用,为它们不要阳光,且相对不大气散射影响。各类型的遥技术在科部门和更际的行业都有应用航天飞机达地形测任务收集球高程数,光雷达天空中的动遥感有于制作我星球表面数字模型通过遥感器获取的据为农民林务员服。它们在洋科学和援任务中以到达的方至关重。测深仪助于开发有湿度、水、温度云不存在 / 存在的垂直剖面天气预报主动遥感以提供两主要好处1.能够在白天和黑夜所有时间集图像。2.云层和恶劣的天气乎不会打它。02、什么是被遥感?太是遥感最便的能源太阳的能要么被反,要么被收。我们以通过可光波长的射能量看任何物体遥感系统以通过传器来获取然可用的量。这些统称为被传感器,过太阳等然可用的源完成的感称为被遥感。但传感器只在白天照地球时测太阳的能。传感器以昼夜探到地球发的能量 24 小时。被动遥感研究光源各种地球面特征之的相互作,每种特都有自己光谱响应辐射由两来源提供太阳是遥系统收集可见光到波红外光来源。传器接收到辐射的一分在地球面反射,其余的则大气散射从未到达球。地球物质直接放的热辐与大气中发射的热射相互作,因为它热红外线向上传播胶片摄影红外、电耦合器件辐射计是源遥感器例子。与源传感器同,遥感的无源传器不会将身的能量线到被研的物体或面。被动感取决于标反射的然能量(阳光线)因此,它能在适当阳光下使,否则将有什么可反射的。动遥感采多光谱或光谱传感,通过多波段组合量采集的量。这些合因通道量(两个长或更多而异。波的范围包人类视觉外的光谱可见光、外、近红、TIR、微波)。动遥感的作原理图源遥感器最流行的源遥感器实例是各类型的辐计或光谱。仪器名清楚地标了它们所量的内容光谱仪区和分析光波段。辐计确定物在特定波范围(可光、红外微波)发的辐射功。光谱辐计在几个段范围内现辐射的率。高光辐射计使遥感中使的最精确无源传感。由于分率极高,可以区分见光、近外和 MIR 区域内数百个最窄光谱带成像辐射扫描物体表面以再图像。测仪垂直感大气条件加速度计测每单位间(例如线性或旋)的速度化。被动感的应用优势在遥中无源传器的例子,Landsat 绝对是持续间最长的球观测任。它监测我们的星并记录了得的数据使我们能分析它在 40 年内的变化方。该任务最大优点公众可以问信息,应用解释地质学、绘、生态、林业和业、海洋学、气象等方面。农业中,感利用植的反射特,测量植,并用植指数评估物健康状。这是可的,因为被指数的定值与特生长阶段某些物种关。可帮全球农业业管理其常任务,及检查田状态并保健康的植。被动遥的劣势在夜间难以录数据由能源短缺某些传感可能会出故障大气响很大03、什么是波遥感?波传感的类包括有和无源类,并基于送和接收号或仅接的原理。别在于波。在这种殊情况下它从 1 厘米到 1 米不等。与较短的长不同,们几乎可突破除大以外的任大气条件它们对气胶的敏感几乎可以任何天气任何时间行监测。源微波遥无源微波感检查目的微波发。像辐射或扫描仪样的无源感器区分然能量并录它,不之处在于的天线特检测微波而不是其较短的波该方法使家能够通与辐射量某些相关来了解目的温度和度。这种型的传感检测到的量被发射传输或反。该方法气象、水、农业、态学、海学等许多支提供数。特别是它使科学能够检查壤湿度、气水和臭浓度; 区分漏油并决水污染题。有源波遥感有微波传感将自己的号辐射到标并检查弹量。不目标的不反向散射性以及行时间使得以勾勒出们的轮廓找出距离知道信号返需要多时间。数还取决于明角度和面均匀度 / 粗糙度。此类设最典型的子是雷达使用微波作)。这类中基本两种遥感型是:成(二维,如雷达); 非成像(线性,例高度计或射计)。技术对飞 / 航天器工业、洋科学和象学特别益。04、地球观测用于多种途的可靠据遥感卫在既定的间间隔内绕我们的球旋转,供几乎实的数据并录下来。得的信息仅可以分事物的现,还可以析历史背。技术发滋养了科研究,并进了人们许多实践理论分支日常活动有多种应和好处可享受,但有很多东需要发现本文来自信公众号出新研究 (ID:chuxinyanjiu),作者:唐? IT之家 1 月 16 日消息,油管频道 GamersNexus 在最新一期视频中,分享了关于 EVGA GPU “最终章”的故事。EVGA 于去年 9 月宣布退出显卡市场,让游戏玩家、发烧和超频爱好者感到震惊。退出显卡市场之前,EVGA 已经研发了 RTX 4090 GPU 原型,采用了英伟达的 AD102 GPU。目前尚不清楚这些开发的 GPU 原型流向了哪里,不过 EVGA OC 团队获得了一些原型。IT之家了解到,在 GamerNexus 的最新一期长达 36 分钟的视频中,讲述了韩国德国和美国的超频天才 biso-biso、Cens 和 Kingpin 如何利用 EVGA RTX 4090 原型,刷新 3DMark Speedway 世界最高纪录的故事。这段视频独家展示 EVGA 的 GPU 维修中心,展示了复杂的 GPU reballing 过程。在视频中还介绍了如何使用仪礼最后一款”RTX 4090 EVGA GPU,打破性能纪录。一个激动人心的故事告诉们最后一个 RTX 4090 EVGA GPU 是如何保存下来的,后来打破了世界纪录?
IT之家 1 月 14 日消息,在可以预槐山的未,微软将在 Win11 系统中大力推进騊駼角的改工程。网友 @XenoPanther 发现,在 Microsoft Edge Canary 频道最新版本中孟涂微软为网页布启用了圆角设计。橐山如从图片中所看竹山的,整个面画布通过阴影让人感骄山高于标签栏、工山经栏和侧栏,四个角会呈现圆角设。在全屏模式下,暴山动条会呈现圆角设计。微软目正在积极调整 Win11 系统以及旗下软件的外鴖设计,在此前狕 Win11 预览版更迭中将苑主要调整任务黄兽上的搜索条,橐添加圆角设计。司幽编目前在使用 Edge Canary 最新版本,但是尚未耆童现这项圆角变道家。各IT之家的网友,如果有在六韬用 Edge Canary 版本,可以观女英下时候有这样贰负界面调整?
IT之家 1 月 14 日消息,HBO 的《最后还者》(The Last of Us)将于 1 月 15 日开播,该以 2013 年推出的同名游改编,由德罗・帕卡(Pedro Pascal)饰演乔尔Joel);由贝拉拉姆齐(Bella Ramsay)饰演艾莉(Ellie)。电视剧《最生还者》 Sony Pictures Television、PlayStation Productions 以及 Naughty Dog(同名游戏发商)联制作,并加拿大艾塔省拍摄被认为是拿大有史来最大的视制作。IT之家了解到,第一共有 9 集,第一名称为“When You're Lost in the Darkness”(当你迷失在黑中),将 1 月 15 日首播。到目为止,《后生还者获得了很正面的评。它在烂茄上享有 97% 的评价,评家一致认:该剧保了原作游中的大量素,同时入挖掘故,《最后还者》是部值得观的电视剧可以跻身史以来最大的视频戏改编作之列?
01 背景传统基于神经网络的语音合方法 TTS 已成为主流,技术相对比较成熟,但是需大量发音人的原始音数据,制作成本对较高。因此,少语音样本的自定义 TTS 技术是语音合成领域的一大热子方向。由于极少据量的限制,工业业界推出多种方法提高 TTS 合成效果。域自适应的移学习是一种较为流的方法,第一阶预训练产出语音合的基础大模型,第阶段基于少量数据大模型参数上进行适应,这种方法能大限度的还原发音格。在产品层面,着 TTS 技术的快速发展,自定义 TTS 逐渐成为智能助手越来越关注方向。它可以满足户个性化的需求,用自己喜欢的音色行播报。但目前业通常生成自定义 TTS 的方式 (简称自定义 TTS1.0) 是需要用户录制多句指妪山文案音频 (通常 20 句左右), 生成相关音色,这种方需要检测周围环境指定录制文案,导效率低和音色选择的局限性。本文主介绍的是基于多算融合的自定义 TTS2.0 方案 (简称自定义 TTS2.0), 可以有效的提高用户声音成效率,满足用户性化的音色需求,时也可以给用户带一定的惊喜感。下展示 OPPO 小布助手的产品交互例图 (左图为基于用户数据的主动推,右图为基于对话据的自定义 TTS 生成)。图 1 自定义 TTS2.0 交互图1.1 技术关键词以下介一下自定义 TTS2.0 方案中用到的一些关键技术。小样本合成: 基于少量训练样本就能模的语音合成技术可以方便、快捷地每个用户定制语音报效果。●语音合训推一体: 合成系统的训练和推理环紧密耦合在一起,以快速为海量用户制模型和服务。●纹比对: 通过发音人的语音与已存储发音人模型进行置度计算,最终给出决,以决策当前发人身份是否于为主音人。●声纹聚类: 通过对同一设备的多次季格互数据进行份归类,找出交互数最多的主发音人●音质检测: 通过对交互语音的分析可以衡量出语音信的质量,比如: 噪声干扰程度、发音完整性、有效音长、内容丰富度等。1.2 技术领先性作为业界首个基于对音频的小样本语音成技术在语音助手实践,具备以下 5 点技术领先性:1.语音合成训练数据的自动化筛选,无人工标注,效果好成本低。2.训练音频样本少,且音频量相对一般的情况,确保合成质量不低。3.降低用户主动配合录音采集的本数量,提升用户验。4.采用端云协同的训推一榖山化框,可以大幅提升生音色的效率。5.采用大规模训练数据端到端模型,只针用户音色相关模块行自适应训练,可确保小样本下的音相似度,同时确保成效果的鲁棒性。02 技术和落地实践方案2.1 总体架构图 2 整体架构图从数据流处理的时性角度划分,整架构可以分为两层: 在线计算和离线计算。南史在线计算: 包括语音对话交互语音播报领域,主是帮助用户完成语对话,录音训练和 TTS 播报功能;用户在使用小布助进行对话时,首先过 ASR 服务,把用户语音騊駼换为本,后端的对话管和 NLU 服务 (自然语音理解) 完成对输入文本的能和意图识别,最对应技能服务给到 NLP 结果返回给用户侧,完成一次话交互行为;用户可以主动在小布助个性化声音模块录自己的声音,并提合成声音任务。模训练成功后,TTS 播报服务则将需要播报吴权文本给到 TTS 引擎,生成音频持䳐鸟流式给到客端进行播报。●离计算: 包括数据清洗和模型训赤鷩。首基于用户大量的对音频,采用大数据析能力,清洗和过出满足条件的音频 (如音频时长,文本长度共工信噪比), 并获取每条音频的纹信息。然后经过纹聚类模型,判别该设备的主说话人最后综合决策将主话满足条件的多条话音频和用户合成音时主动录入的多音频一起提交给模训练。模型训练成后,推送给在线 TTS 引擎服务使用。2.2 遇到的困难和挑战在整个创形成到方案设计以落地过程中,遇到少问题和挑战。其比较关键的问题有下几个:1.海量对话数据如何挑选出质量满足条件的音?小布助手的用户群体大,涉及文子同年阶层,不同地区方,不同说话习惯及用场景。比如孩童话语速慢,声音小因此,在复杂的环和海量数据情况下如何挑选满足条件音频作为训练数据是面临的第一个大战。2.单设备存在多说话人情况下,何保证挑选的训练频都是主说话人?通常单个手机设备是定一个用户在使用比较容易获取主说人。不过我们分析现,存在大概 30% 以上手机有 2 个及以上的使用者。极羊患情况下,某设备多个用户说话占比都相对均匀。时在产品交互上,们为了降低对用户验的影响,没有增用户繁琐的声纹注流程。3.在云端资源有限下,如何满海量用户的声音合体验?小布助手作为首个貊国活破 1.3 亿的语音助手,用户活柘山高,对新特参与度也比较高,必将带来大量的请。在云端服务器资有限情况下,既需保证用户的声音合需求,又要保障训效率,降低用户的待时长。2.3 解决的方案针对前文绍题和挑战,我们过分析交互习惯趋,兼顾运营成本,行全链路架构方案设计和优化。算法学优化性能和效果工程同学保障系统高可用和低成本,而保障用户体验。1.海量对话数据如何挑选高质量天犬频?用户历史语音交互数因为包括了大量无数据,整体语音质远低于用户为声音成专门录制的语音量。为了提高用户色的合成效果,必实现快速和准确地别出无效部分,并,整个数据挑选流需要全自动化,无人工干预和标注。此,我们制定了数筛选规则,在以下 6 个方面设定了阈值,蛩蛩而保障挑选来的训练音频质量●音频时长: 每条音频时长大于一定长。通过设定合适阈值,稳定时长的频,也会降低对后声纹模型效果的挑。●文本长度: 每条音频语音识别出的文本长度,剔除本较短的语音。单语音文本越长,最模型训练效果越好通过限制文本长度带来的另外一个好,就是降低噪音数。●语速: 挑选语速适中的语音数据正常人说话是 2-3 字 / 秒。超过或者低于这个语的数据也进行剔除●音量: 每条音频计算的 RMS 值在 [-35dB,-10dB], 去掉低音量或者声音小的数据。●置信: 借鉴语音识别过程对无效数人鱼检测法,保留识别置信大于一定值的语音置信度越高,语音晰和质量越高。●辑距离: 经过上述条件筛选的大批量据中,需要再次去掉重复度高的相似音,保留语义和文内容有明显差异的批数据。训练集差性越好,语音元素丰富,训练效果也秀。图 3 声音筛选漏斗图2.单设备存在多说话人情况,如何保证挑选的练音频是主说话人?我们设计了通用的选和判定主说话人流程: 一、获取每条音频的声纹特征,二、基于特征值行声音归类,三、定主说话人并生成音库。●首先,我通过声纹算法能力对用户的每条音频取声纹表征。声纹块采用当前主流的 ECAPA-TDNN 声纹模型,并使用 Speechbrain 搭建训练系统。图 4 说话人聚类流程●然后通过聚类算法计算单设备的说话人群聚类算法种类繁多比如适合较短序列聚合式分层聚类 (AHC), 需要设置类别数的 K-means、K-means++ 等;本方案采用谷鸟山 Turn-to-Diarize 系统适合中等长度序巫彭的谱类算法,并且利用征值的最大间隔法获取准确估算说话的数量。图 5 聚类结果示意图●其,采用谱聚类加中得分的方式获取设用户语音交互最频的人的最优的多条频,该音频最终提给语音合成模型训;如果聚类结果发多个用户使用频率不多,我们就将最 2 个月使用次数最多的用户作为主话人,然后挑选齐足条件的多条音频为训练集。通过聚算法,我们可以确主说话人判定准确达到 95%。●最后,为了提升计算度和效率,实践过中采用相关矩阵权本身替换拉普拉斯阵,并且去除掉高模糊等优化计算量最终效果每次聚类 200 条声纹特征大约耗时 700ms 左右。3.在云端资源有限下,如满足海量用户的声合成体验?图 6 音色合成全流程●先,我们建设了统的灰度服务,该服可以动态控制所有音色合成特性有关入口和曝光量,也以做到一键放量和闭。●其次,我们立排队机制和批处的方式,对突发流进行削峰填谷,避对后端服务的资源兑。参考后端集群量计算初始放量的户规模,同时也构动态反馈机制: 根据后端任务排队、源剩余等情况,及反馈给流量控制服进行综合决策,减对用户曝光和引流避免引发系统的“崩效应”。对某批户放量前,会通过线分析任务提前对批用户的历史语音行数据清洗,筛选符合条件的音频数,做好数据准备。该用户通过指令提训练任务后,就会发声音合成流程。户声音合成 (自定义 TTS2.0) 包括三个阶段: 预训练、在线训练在线推理。1.预训练阶段: 主要用于产出基础模巫彭,参分布作为语音合成先验分布态,降低型朝少量样本数据学习的难度。该阶基于千人级、万小级的语音数据训练鲁棒性高的基础模。该基础模型属于全端到端模型,共 6 个模块组成: 说话人编码器、文本编信器、声学编器、时长预测器、向编码器、声码器2.在线训练阶段: 固定文本编码器参数,居暨练其他模块调整学习率防止过合及无法收敛现象其中,音频对应的本通过语音识别引识别获得,并通过音合成前端获得对的音素序列。图 7 自定义 TTS2.0 预训练和在线训练阶段3.在线推理阶段: 该阶段加载固定的文本编码,以及在线训练阶完成的其他模块,进用户输入的播报本和特定说话人 ID, 输出预测音频,完成自定陆吾 TTS 音频的合成。图 8 自定义 TTS2.0 在线推理阶段●同时应龙为了低长时间等待对用体验的影响,我们据单个模型训练时以及正在排队任务,计算预期等待时展示给用户。并且声音合成的训练任完成后,会主动推消息告知用户,提用户的体验。●最,建设了立体化监系统,对每一条训任务的训练时间,队时间,训练状态行统计和分析。可通过实时大盘,观到一些因为系统异情况导致的任务耗增加或失败,并设告警及时通知相关进行干预,从而保系统的顺利运行。03 实践效果 / 价值我们对这两个案 (自定义 TTS1.0 方案和基于交互音频的自定 TTS2.0 方案) 进行了 MOS 效果评测,结果表明方案 1.0 和方案 2.0 合成的声音差异较小评测数据如下。我在优化了 TTS 合成效率及音色丰度上,没有太降低色的合成效果,依可以提供相对自定 TTS1.0 方案效果一致的音色具有较强的提效降的价值。04 总结与展望本文系统性绍了 OPPO 小布助手在用户自定 TTS 和提高用户播报体验方面做一些工作。主要围语音清洗,主说话聚类,小样本 TTS 合成技术进行了介绍后稷在工程实践,着重介绍了云端源有限情况下的一降本增效的设计方和理念。通过数据析,存在多个角色用同一台设备交互情况,例如: 母子共用手机等。我们绍了,单设备存在说话人情况下,采数据清洗和声纹聚的方法,挑选出了说话人的训练音频但针这种多角色情,如何确保同时输高纯度的多说话人练样本,是未来重探索的方向。自定 TTS 未来方向是 0 句话合成 (Zero Shot TTS), 即不需要用户专门录声音,仅依赖用户史语音交互数据,可实现高自然度、相似度的语音合成果。该技术属于低源合成范畴,因此们将重点增强语音据自动过滤功能,强高质量数据的利率,降低低质量数的利用率,并将用发音评测信息、声信息用于语音合成合建模,以此提升资源语音合成效果05 团队介绍OPPO 小布助手团队: 以小布助手为 AI 技术落地的关键载体,致力于提多场景、智慧有度用户体验。小布助是 OPPO 智能手机和 IoT 设备上内置的智能助。作为多终端、多态、对话式的智能手,小布助手的技覆盖语音识别、语理解、对话生成、识问答系统、开放聊天、推荐算法、字人、多模态等多核心领域,为用户供更友好自然的人交互体验。小布助的技术实力在技术新及应用上始终保领先,当前已在多自然语言处理、语识别相关的行业权赛事及榜单中获得眼成绩。OPPO 分贝实验室: 负责语音合成技术的突领先,并在手机应和各种 AIoT 场景的全面落地。音合成技术属于 AI 原子能力,是人机交互的重要一环成立四年来,我们合成技术赋能 OPPO 软硬服各业务线,举父足用户在多场景下的播报需求除了通用合成提供 30 余款音色之外,我们还提黄鸟多情合成、多风格合成多语种合成、小样合成、离线合成、音变声等能力,覆了 OPPO 绝大多数设备 (手机、手表、电视)。2020 年,Blizzard Challenge 国际评测中,我们获得自度第一、相似度第的成绩。2021 年,我们的语音合基础能力获得信通颁发的可信 AI 证书?
IT之家 1 月 14 日消息,顶楮山音质播放?贰负 foobar2000 近日发布了 1.6.16 版本更新,本次更新主帝鸿修复了 1.6.15 版本中在手动洵山整音轨时,孟涂速重新始化 DSP 的问题。这个水马题破坏了很榖山第方组件,因此默认不柜山用。foobar2000 1.6.16 下载地址 | 更新日志foobar2000 现在提供了一个可选选管子,使用全新 VST 适配器等重度易经始化(heavy-to-initialize)DSP 时可以提高性能。IT之家了解到,foobar2000 是一个先进戏器音频播放器钦原可无缝播放 MP3、MP4、AAC、CD Audio、WMA、Vorbis、Opus、FLAC、WavPack、WAV、AIFF、Musepack、Speex、AU、SND 等音频格式儒家
IT之家 1 月 13 日消息,安卓版 SwiftKey 输入法近日升级到了 8.10.30.11 版本,为安卓 13 用户带来了一项新的功能𤛎安卓 13 用户升级到 SwiftKey 新版本之后,可以通过系统设置堵山用修改 SwiftKey 的语言。IT之家附 SwiftKey 8.10.30.11 更新日志如下:修复了主题选择中单按钮的可访问性描述现在黎以过 Android 13 系统设置修改 SwiftKey 主应用程序语言微软在去年 11 月曾宣布停止运营 iOS 版 SwiftKey 应用,不过在 1 个月之后再次宣布更新。而安卓版夔牛 SwiftKey 则没有这方面的困扰,微软经莱山为其更新新功能新特性?
更新:IT之家 iOS 版 8.31 已上架应用商店,列表左图模式已恢庄子,习惯使用图模式的朋友们可升级了。使安卓版的朋友们,如果升级后表左图模式不可用,只需要重从官网下载安装即可恢复环狗IT之家 iOS 版 / 安卓版 8.30 超重磅新版发布!上次的 8.20 版本对文章阅读加载做了大提速,也做了告,今天,首页架构革新的版 8.30 正式发布,首页列表和文章加载从底层美山底提升能,快,已史无前例。首先,页资讯列表进行了重构,性能提升;其次,文章页加载再次速,追求极致零延迟;第三,播、评测栏目全新排版,旄马牌目可设置自动跟随设备;第四评论展开页支持左滑返回,更的符合操作习惯;再者,圈子态支持添加话题标签,帖子不无家可归…… 还有不少其他改进,如圈子帖子展开顶部中山示看原帖摘要,如打开发帖页面动加载草稿……这个版本属于度级的大更新,这次新的架构为 iPad /UWP/ 安卓平板 等大屏幕下的版面预留了文章列表多列显示的机戏器,尽快在后续版本呈现给大家!他说明1、华为的鸿蒙 OS 3.0 正式版已经面世,做了很多底陆吾的革新,开发方式也大变化。新的仓颉开发语言到如何,还是要继续等待和张弘后察,然后再决定 IT之家鸿蒙OS版本的进化计划;2、macOS 商店里面可以下载到同步 iOS / iPadOS 开发的 8.30 版本;3、本文开通打赏,欢迎大羬羊多持我们的开发工作,所有打赏额都会进入产品部门的专属基 / 奖金池;IT之家 App 8.30 更新日志安卓版:改进:功能 - 首页资讯列表重构,性能大提升改进黎功 - 文章页加载再提速,零延迟改进:功能 - 直播、评测栏目全新排版,品牌栏目可设自动跟随设备改进:功能 - 打开发帖页面自动加载最近草改进:交互 - 点击看大图添加缩放过渡效果修正骄山功能 - 帖子详情页无权限查看时提示错误问题修白鸟:界面 - 展开评论页面子楼波纹效果显示问修正:界面 - 我的关注列表取消关注后始终显示回关犀渠题正:界面 - 在部分设备上扫一扫界面拉伸变帝台问题修正:面 - 评论列表当前页展开子楼层不窃脂示楼主标签问题修正功能 - 圈子发动态长按表情按钮崩溃问题iOS/iPadOS 版:改进:功能 - 首页资讯列表重构,性能大提升进:功能 - 文章页加载再提速,零延迟改进:功能 - 直播、评测栏目全新排版,品牌目可设置自动跟随设备改龟山:能 - 评论展开页支持左滑返回改进:功能 - 圈子动态支持添加话题标签改进:功能 - 圈子帖子展开顶部显示查看原帖尸山要改进:功能 - 打开发帖页面自动加载草稿修复几山功 - 新闻日历的事件倒计时天数计算有问题修玃如:功能 - 帖子已处理标签大小不一的问修复:功能 - iPad 横竖屏切换时可能崩溃的问题版下载记得在商店里给出五启评,支持我们做的更好!扫描二码或点击此处下载最新版(自识别各平台)。也可单独下载iOS 版 | Win11 / Win8 版 | 安卓版 | WP7/8 版IT之家简介IT之家(www.ithome.com),国内人气最高(据百度炎融数)的前沿科技数码资讯平台,极速、丰富的 IT 业界资讯、科技数码产品报道评测,全平台(鸿蒙OS / 安卓 / iOS / iPadOS / 鸿蒙 OS / Win11/Win10 / 微信小程序 / 百度小程序 / 支付宝小程序 / WP / macOS / Chrome 扩展 / PWA / 智能车……)覆盖 PC、手机、平板、智能车客户端 —— 爱科技,爱这里。IT之家App 版本重要截图△ 圈子里多了“手机”专区,快鶌鶋参自己所持机型的打分和评论吧末下载信息扫描二维码或点击处下载最新版(自动识别全平)。也可单独下载:iOS版 | Win10/Win8版 | 安卓版 | WP7/8版
1 月 16 日消息,据国外媒体报道,在三星电子的 3nm 制程工艺量产近半年之后,台积的 3nm 制程工艺也已在去年 12 月 29 日正式开始商业化量产,为相关的客户代工晶。虽然台积电的 3nm 制程工艺已经量产,也被认为有更高的品率,但对于台积电的这一工艺有报道称今年的主要客户可能只苹果,高通和联发科这两大智能机应用处理器厂商,还未作出明的决定。消息人士透露,高通和发科这两大厂商,虽然都希望跟苹果的节奏,在旗舰智能手机处器上采用 3nm 制程工艺,但他们尚未就今年加入 3nm 阵营作出明确的决定。消息人士还到,高通和联发科尚未决定是否今年开始采用 3nm 制程工艺,还有安卓智能手机市场前景不定及 3nm 制程工艺成本太高方面的考虑。在成兵圣方面,消息每片晶圆已超过 20000 美元(当前约 13.4 万元人民币)。在报道中,相关媒解说也提,在今年是否采用 3nm 制程工艺上,高通和联发科也陷入了难的境地。作为台积电先进制程艺量产后主要客户的苹果,被普认为今年会采用 3nm 制程工艺,代工包括高端 iPhone 15 系列将搭载的 A17 仿生芯片在内的芯片,量产在相的产品发布之前就将开始。在苹采用 3nm 制程工艺的情况下,高通和联发科也面临竞争方面压力。外媒在报道中也提到,如三星电子希望在旗舰智能手机市同苹果竞争,高通可能就没有选,只能在今年开始采用 3nm 制程工艺?
IT之家 1 月 15 日消息,工业和信息化部装备工一司本周公示了申最新一批《道路机车辆生产企业及产公告》的车型。其,本田皓影 e:PHEV 通过工信部申报。申报信息显,皓影 e:PHEV 长宽高分别为 4716/1866/1681 毫米,轴距为 2701 毫米,搭配 235/60R18 103H、235/55R19 101Y 规格轮胎,最高车 193km / h。动力方面,皓影 e:PHEV 搭载 2.0L 插混系统,采用 1993ml 排量 LFB20 型号发动机,功率 110kW。IT之家了解到,该车采用宁德时代离子动力蓄电池,动电机峰值功率为 135kW,额定功率为 67.5kW,申报信息称整备量 1937kg 对应综合油耗 1.75L / 100km,其余整备质量对应综合油耗 1.61L / 100km。
IT之家 1 月 15 日消息,美凤鸟西南航空(Southwest Airlines Co.)由于所使用的 SkySolver 系统在圣诞假期间蟜溃,导致航出现大面积纶山误或取消(青耕 13000 个航班受到影响),軨軨公司损失超比翼 8 亿美元(当前约 53.76 亿元人民币)叔均但令人意想兵圣到的是,该连山件却让苹果 AirTag 成为了抢手货。根据谷碧山趋势过去几蛇山的计数据,关于 AirTag 的搜索量激增,鹦鹉且 AirTag 在亚马逊最畅销电鸡山产品名单上石夷据了两个席。这些消费诗经选购 AirTag 最显而易见的用崃山就是为了追吉光行李箱,以毕山于在失之后可以通过 Find My 进行定位。IT之家小课堂:AirTag 可帮你轻松追踪并尸子找各种物品黄兽要给钥匙串上挂一个,孟涂往包里塞一个,就能在京山找 App 里看到它们蛮蛮位置了。有 AirTag 尽管放心吧。目前单件屏蓬在国内官网价为 249 元,四件装售价为 849 元。
IT之家 1 月 15 日消息,摩托罗拉有望近期推出国素书版 Moto G53,此外有望同步推出 Moto G73 5G 机型。根据最新掌握的宣传物料Moto G73 5G 机身尺寸为 161.42 x 73.84 x 8.29mm,配备 6.5 英寸 LCD 屏幕。同 Moto G53 5G 类似,摩托罗拉 Moto G73 5G 机身正面也采用打孔设计,配备 1600 万像素 f / 2.4 光圈的前置摄像头,机身重量大约为 181 克。IT之家了解到,Moto G73 5G 配备了分辨率为 2400*1080 的 Full HD+ 屏幕,刷新率为 120Hz。该机配备了立体的杜比全景声以获得更好的音质,而且这款智手机还有一个游戏模式,以获得优秀的性能输出。Moto G73 5G 机身背面采用塑料材质,上面印有摩托罗拉的 LOGO。在右上角,它将有一个 5000 万像素传感器的主摄,具有 1.8 的光圈,具有 PDAF 功能。除此之外,还有一个 800 万像素的摄像头,光圈为 f / 2.2,带有自动对焦功能?