top of page

我们的社交媒体

  • YouTube Social  Icon
  • QQ图片20190302213724
  • Facebook Social Icon
  • QQ图片20190302213855
Vandaveli.png
Image_20240605103349.png

我们的合作伙伴

2.png

文章来源: 娱乐圈哔哔King

与英伟达的GPU相比,谷歌TPU采用低精度计算,几乎不影响深度学习处理效果的前提,比基于英伟达 A100 芯片的系统快 1.7 倍,能效高 1.9 倍。


我们还没有看到能与 ChatGPT 相匹敌的 AI 大模型,但在算力基础上,领先的可能并不是微软和 OpenAI。 本周二,谷歌公布了其训练语言大模型的超级计算机的细节,基于 TPU 的超算系统已经可以比英伟达的同类更加快速、节能。

谷歌张量处理器(tensor processing unit,TPU)是该公司为机器学习定制的专用芯片(ASIC),第一代发布于 2016 年,成为了 AlphaGo 背后的算力。与 GPU 相比,TPU采用低精度计算,在几乎不影响深度学习处理效果的前提下大幅降低了功耗、加快运算速度。同时,TPU 使用了脉动阵列等设计来优化矩阵乘法与卷积运算。 当前,谷歌 90% 以上的人工智能训练工作都在使用这些芯片,TPU 支撑了包括搜索的谷歌主要业务。作为图灵奖得主、计算机架构巨擘,大卫・帕特森(David Patterson)在 2016 年从 UC Berkeley 退休后,以杰出工程师的身份加入了谷歌大脑团队,为几代 TPU 的研发做出了卓越贡献。

ree

如今 TPU 已经发展到了第四代,谷歌本周二由 Norman Jouppi、大卫・帕特森等人发表的论文《 TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings 》详细介绍了自研的光通信器件是如何将 4000 多块芯片并联成为超级计算机,以提升整体效率的。

TPU v4 的性能比 TPU v3 高 2.1 倍,性能功耗比提高 2.7 倍。基于 TPU v4 的超级计算机拥有 4096 块芯片,整体速度提高了约 10 倍。对于类似大小的系统,谷歌能做到比 Graphcore IPU Bow 快 4.3-4.5 倍,比 Nvidia A100 快 1.2-1.7 倍,功耗低 1.3-1.9 倍。

除了芯片本身的算力,芯片间互联已成为构建 AI 超算的公司之间竞争的关键点,最近一段时间,谷歌的 Bard、OpenAI 的 ChatGPT 这样的大语言模型(LLM)规模正在爆炸式增长,算力已经成为明显的瓶颈。

由于大模型动辄千亿的参数量,它们必须由数千块芯片共同分担,并持续数周或更长时间进行训练。谷歌的 PaLM 模型 —— 其迄今为止最大的公开披露的语言模型 —— 在训练时被拆分到了两个拥有 4000 块 TPU 芯片的超级计算机上,用时 50 天。

谷歌表示,通过光电路交换机(OCS),其超级计算机可以轻松地动态重新配置芯片之间的连接,有助于避免出现问题并实时调整以提高性能。

下图展示了 TPU v4 4×3 方式 6 个「面」的链接。每个面有 16 条链路,每个块总共有 96 条光链路连接到 OCS 上。要提供 3D 环面的环绕链接,相对侧的链接必须连接到相同的 OCS。因此,每个 4×3 块 TPU 连接到 6 × 16 ÷ 2 = 48 个 OCS 上。Palomar OCS 为 136×136(128 个端口加上 8 个用于链路测试和修复的备用端口),因此 48 个 OCS 连接来自 64 个 4×3 块(每个 64 个芯片)的 48 对电缆,总共并联 4096 个 TPU v4 芯片。

根据这样的排布,TPU v4(中间的 ASIC 加上 4 个 HBM 堆栈)和带有 4 个液冷封装的印刷电路板 (PCB)。该板的前面板有 4 个顶部 PCIe 连接器和 16 个底部 OSFP 连接器,用于托盘间 ICI 链接。 随后,八个 64 芯片机架构成一台 4096 芯片超算。

与超级计算机一样,工作负载由不同规模的算力承担,称为切片:64 芯片、128 芯片、256 芯片等。下图显示了当主机可用性从 99.0% 到 99.9% 不等有,及没有 OCS 时切片大小的「有效输出」。如果没有 OCS,主机可用性必须达到 99.9% 才能提供合理的切片吞吐量。对于大多数切片大小,OCS 也有 99.0% 和 99.5% 的良好输出。

ree

与 Infiniband 相比,OCS 的成本更低、功耗更低、速度更快,成本不到系统成本的 5%,功率不到系统功率的 3%。每个 TPU v4 都包含 SparseCores 数据流处理器,可将依赖嵌入的模型加速 5 至 7 倍,但仅使用 5% 的裸片面积和功耗。

「这种切换机制使得绕过故障组件变得容易,」谷歌研究员 Norm Jouppi 和谷歌杰出工程师大卫・帕特森在一篇关于该系统的博客文章中写道。「这种灵活性甚至允许我们改变超级计算机互连的拓扑结构,以加速机器学习模型的性能。」

在新论文上,谷歌着重介绍了稀疏核(SparseCore,SC)的设计。在大模型的训练阶段,embedding 可以放在 TensorCore 或超级计算机的主机 CPU 上处理。TensorCore 具有宽 VPU 和矩阵单元,并针对密集操作进行了优化。由于小的聚集 / 分散内存访问和可变长度数据交换,在 TensorCore 上放置嵌入其实并不是最佳选择。在超级计算机的主机 CPU 上放置嵌入会在 CPU DRAM 接口上引发阿姆达尔定律瓶颈,并通过 4:1 TPU v4 与 CPU 主机比率放大。数据中心网络的尾部延迟和带宽限制将进一步限制训练系统。

对此,谷歌认为可以使用 TPU 超算的总 HBM 容量优化性能,加入专用 ICI 网络,并提供快速收集 / 分散内存访问支持。这导致了 SparseCore 的协同设计。

SC 是一种用于嵌入训练的特定领域架构,从 TPU v2 开始,后来在 TPU v3 和 TPU v4 中得到改进。SC 相对划算,只有芯片面积的约 5% 和功率的 5% 左右。SC 结合超算规模的 HBM 和 ICI 来创建一个平坦的、全局可寻址的内存空间(TPU v4 中为 128 TiB)。与密集训练中大参数张量的全部归约相比,较小嵌入向量的全部传输使用 HBM 和 ICI 以及更细粒度的分散 / 聚集访问模式。

作为独立的核心,SC 允许跨密集计算、SC 和 ICI 通信进行并行化。下图显示了 SC 框图,谷歌将其视为「数据流」架构(dataflow),因为数据从内存流向各种直接连接的专用计算单元。

最通用的 SC 单元是 16 个计算块(深蓝色框)。每个 tile 都有一个关联的 HBM 通道,并支持多个未完成的内存访问。每个 tile 都有一个 Fetch Unit、一个可编程的 8-wide SIMD Vector Processing Unit 和一个 Flush Unit。获取单元将 HBM 中的激活和参数读取到 2.5 MiB 稀疏向量内存 (Spmem) 的图块切片中。scVPU 使用与 TC 的 VPU 相同的 ALU。Flush Unit 在向后传递期间将更新的参数写入 HBM。此外,五个跨通道单元(金色框)执行特定的嵌入操作,正如它们的名称所解释的那样。

与 TPU v1 一样,这些单元执行类似 CISC 的指令并对可变长度输入进行操作,其中每条指令的运行时间都取决于数据。

在特定芯片数量下,TPU v3/v4 对分带宽比高 2-4 倍,嵌入速度可以提高 1.1-2.0 倍。

下图展示了谷歌自用的推荐模型(DLRM0)在不同芯片上的效率。TPU v3 比 CPU 快 9.8 倍。TPU v4 比 TPU v3 高 3.1 倍,比 CPU 高 30.1 倍。谷歌探索了 TPU v4 超算用于 GPT-3 大语言模型时的性能,展示了预训练阶段专家设计的 1.2 倍改进。

ree

虽然谷歌直到现在才公布有关其超级计算机的详细信息,但自 2020 年以来,基于 TPU 的 AI 超算一直在位于俄克拉荷马州的数据中心发挥作用。谷歌表示,Midjourney 一直在使用该系统训练其模型,最近一段时间,后者已经成为 AI 画图领域最热门的平台。

ree

谷歌在论文中表示,对于同等大小的系统,其芯片比基于英伟达 A100 芯片的系统快 1.7 倍,能效高 1.9 倍,后者与第四代 TPU 同时上市,并被用于 GPT-4 的训练。

对此,英伟达发言人拒绝置评。

当前英伟达的 AI 芯片已经进入 Hopper 架构的时代。谷歌表示,未对第四代 TPU 与英伟达目前的旗舰 H100 芯片进行比较,因为 H100 在谷歌芯片之后上市,并且采用了更先进的制程。

但同样在此,谷歌暗示了下一代 TPU 的计划,其没有提供更多细节。Jouppi 告诉路透社,谷歌拥有开发「未来芯片的健康管道」。

ree

TPU v4 比当代 DSA 芯片速度更快、功耗更低,如果考虑到互连技术,功率边缘可能会更大。通过使用具有 3D 环面拓扑的 3K TPU v4 切片,与 TPU v3 相比,谷歌的超算也能让 LLM 的训练时间大大减少。

性能、可扩展性和可用性使 TPU v4 超级计算机成为 LaMDA、MUM 和 PaLM 等大型语言模型 (LLM) 的主要算力。这些功能使 5400 亿参数的 PaLM 模型在 TPU v4 超算上进行训练时,能够在 50 天内维持 57.8% 的峰值硬件浮点性能。

谷歌表示,其已经部署了数十台 TPU v4 超级计算机,供内部使用和外部通过谷歌云使用。 本文作者:泽南,来源:机器之心,原文标题:《谷歌TPU超算,大模型性能超英伟达,已部署数十台:图灵奖得主新作》

2023股市面临巨大风险,关注“一级市场”投资机会


我们特别邀请了中国第一个私人银行(北京商业银行)的发起人 - John Wang为我们一对一解析一级市场投资机会和风险 “一级市场”投资研讨,不对公众开放,仅限“实名”认证的注册会员


加入方式: 1, 微信: Vandave 2, WhatsApp: 604-7227628 3, 视频号: 时空“资升堂”联系在线客服


风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

ree
ree

免责声明

文章内容不代表本网站立场。 如有争议,请随时联系我们!


扫码关注我们吧

微信公众号|温渡传媒

资深媒体人|华美嘉

社群运营 · 融媒制作

公关策划 · 活动推广

ree

商务合作:1-778-707-5568

Email:vandomediacorp@gm

ail.com

YouTuBe:https://www.youtube.com/vandomedia

Instagram:VandoMedia

Facebook:https://www.facebook.com/reneezhao716VOA




 
 

文章来源: 娱乐圈哔哔King

今天,港媒报道了巩俐和老公让米歇尔雅尔乘坐飞机来北京的画面,一时间也是引起不少人的围观和热议,尤其这一次巩俐和老公乘坐的飞机可是法国总统的专机,网友们都点赞巩俐真的是很有排面。

ree

当天巩俐和老公一起下飞机,巩俐披着淡黄色的毛衣,戴着墨镜,十分优雅十分有范儿。而让米歇尔雅尔则是全程搬着行李,两个超大的行李箱,就像是巩俐的助理一般,果然是超级宠妻。当然网友们也是点赞74岁的巩俐老公也是很有力量,在妻子面前可是绅士十足。

ree

据悉,这一次巩俐和老公来北京是要停留几天的,并且很可能会和马卡龙一起参加中法外交晚宴,是不是听起来都觉得特别的厉害呢?所以说巩俐可不是一般的明星了,难怪人家巩俐曾经说过自己不是明星,不要把自己看成明星,自己不希望被这样称呼。

ree

在外国人眼里,巩俐不仅是伴奏大师米歇尔雅尔的妻子,更是中国首屈一指的艺术家。这一次巩俐和老公乘坐法国总统专机回娘家,这排面真的是厉害了,试问娱乐圈哪位艺人能够有此殊荣呢?

ree

巩俐和老公是十分恩爱的夫妻,可以说是娱乐圈的模范夫妻了。虽然他们是在2019年才低调结婚的,但是目前感情十分深厚,几乎是走到哪里都是形影不离,巩俐多次回国都是带着老公的,可见两个人的感情程度。

ree

如今巩俐已经57岁,但是整个人的状态还是很好的,尤其是脸部的皮肤很紧致很白皙,并且身材也是很丰满凹凸有致,似乎和20几年前一样,所以巩俐才是真正的冻龄女神,在保养这方面巩俐也是分享过自己的秘籍,就是要好好运动,保持充足的睡眠。

ree

巩俐夺得过超多影视大奖,更是在欧洲三大电影节上担任评委和主席的职位,可以说巩俐的地位超然,所以和米歇尔雅尔在一起,还真的是门当户对,只是让米歇尔雅儿比巩俐大了17岁,不过年纪从来都不是阻碍他们感情的鸿沟。

ree

不少粉丝们得知巩俐回来中国了,并且还带着老公,所以已经开始准备在北京偶遇巩俐了。要知道巩俐也是超级宠粉的,昔日里见到粉丝们也是很开心的合影,网友们都点赞她是最接地气的超级巨星。

ree

超有范!巩俐夫妇乘法国总统专机回娘家,老公全程拎行李超宠妻。希望这一次巩俐和老公能够在北京玩得开心,留下更多开心的记忆。

ree

搜狐娱乐讯(视觉中国/图)4月5日下午,法国总统马克龙乘坐的专机抵达北京。有网友从央视新闻的镜头中发现,著名女演员巩俐也出现在马克龙的随行代表团中,而走在她前面的正是她的法国老公让-米歇尔·雅尔。

ree

巩俐穿着风衣外套,戴着墨镜打扮时髦。

ree

巩俐与法国老公让-米歇尔·雅尔同框现身,笑容满面,状态超好。

ree

巩俐与法国老公让-米歇尔·雅尔牵手热聊旧照,两人的感情超好!

2023股市面临巨大风险,关注“一级市场”投资机会


我们特别邀请了中国第一个私人银行(北京商业银行)的发起人 - John Wang为我们一对一解析一级市场投资机会和风险 “一级市场”投资研讨,不对公众开放,仅限“实名”认证的注册会员


加入方式: 1, 微信: Vandave 2, WhatsApp: 604-7227628 3, 视频号: 时空“资升堂”联系在线客服


风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

ree
ree

免责声明

文章内容不代表本网站立场。 如有争议,请随时联系我们!


扫码关注我们吧

微信公众号|温渡传媒

资深媒体人|华美嘉

社群运营 · 融媒制作

公关策划 · 活动推广

ree

商务合作:1-778-707-5568

Email:vandomediacorp@gm

ail.com

YouTuBe:https://www.youtube.com/vandomedia

Instagram:VandoMedia

Facebook:https://www.facebook.com/reneezhao716VOA




 
 

文章来源: 华人生活网

撰文:外滩 在当下美国,最让人痴迷的亚裔偶像是谁?答案不是什么BTS防弹少年团或Blackpink,而是刚在美国国会经历了5小时折磨质询,依然风度翩翩的“美国抖音”TikTok首席执行官、40岁的新加坡人周受资。

ree

在该平台上,数以千万计的用户力挺周受资,其中涌现出了大量迷妹粉。迷妹们开始叫他TikTok Daddy,甚至自称Tiktok's babygirl——放在中文饭圈语境里,就是“老婆”。 如同粉丝对明星偶像的那些应援一样,他们把周受资的新闻截图、照片制作成短片,加上浪漫的滤镜和爱心点缀。“感谢美国国会,让这个男人成了美国最有魅力的单身汉……”这条评论下面,立马有人纠正:“单身啥呀,人家有老婆的,你靠边站吧。”


美国粉丝的新Daddy

3月23日的这场美国国会质询,针对短片分享应用程式TikTok和其母公司字节跳动,围绕的大多数问题都是关于这个来自中国的app,是否会威胁美国用户的数据安全和隐私保护,背后的用意相信中国网友都多少明白,就不赘述了。总之,它可能决定了TikTok是否会继续面临强制出售甚至被禁,对于这个有着1.5亿月活用户的社交软件来说是生死存亡的时刻。 “我叫周受资,出生于新加坡,曾在新加坡军队服役,在英国读的大学,然后来到美国念商学院。在这里遇到了我的妻子,她就出生在离这里几英里之外……”这段温情且淡定的开场白,其实就拉拢了无数正在看直播的TikTok用户。 之后的近5个小时里,他面对台上六七十岁的美国议员们各种荒唐的提问。这包括无数次被“你只要回答『是』或『不是』”粗暴打断,依然能保持风度,条理清晰。 “我替美国国会向周受资道歉,你表现得很好。”一位TikTok用户写道。听证会结束没多久,40岁的周受资就成了美国年轻网民的新宠儿,严格来说是“新宠爹”。在TikTok上,历来就有“粉爹”的传统,他们称之为“Zaddy”(出自同名说唱歌曲),意为有腔调的老爹。 在周受资之前,他们最热衷的Zaddy是《曼达洛人》(Mandalorian)、《最后生还者》(The Last of Us)主演佩德罗帕斯卡(Pedro Pascal)。周受资横空出世后,粉丝们哄笑着让“佩德罗帕斯卡先休息一下吧”。“这个新加坡CEO那么帅的吗?!”“哇这就是我理想中成功人士的样板!”类似的评论比比皆是。 愈来愈多的人关注起周受资的外形,有人将他和Netflix热播剧《黑暗荣耀》的主演郑成日作比较,“而且他明显有着很好的身材管理,可以看得出体脂率很低,是个自律的人”。TikTok用户们开始大量制作关于周受资的粉丝滤镜片,有些女粉丝非常直接地表达自己对于Mr. Chew的“渴望”。


亚裔精英的模板

除了外形,周受资的履历也的确符合大多数人对于亚裔精英的幻想。他1983年出生于新加坡一个普通家庭,天资聪颖,12岁时考了全国第一,进入名校新加坡华侨中学。毕业服兵役,退伍后赴英留学,2006年伦敦大学经济系毕业,进入高盛,还在哈佛顺便读了个MBA。 他中英文都很流利,加入俄罗斯国际投资基金DST担任合伙人后,大量接触中国科技巨头,包括小米、京东、阿里巴巴、滴滴等。32岁时,周受资加入小米集团,5年升至高级副总裁,成为合伙人。许多中国人也是那时候知道了他。儘管被一致看好成为雷军接班人,2021年,周受资仍然在张一鸣邀请下跳槽到了字节跳动担任CFO,两个月后成了TikTok的新任CEO。 在大洋彼岸年轻人集体犯花痴的同时,中国网友们因为身处TikTok的梦幻肥皂泡之外,吃起瓜来显然更理智,但也对周受资有着一致好评。“他身上有一种气质,和马斯克、雷军这些科技创业者所表现出的进取感不同,周受资就是那种典型的职业经理人帅哥。”“如果你接触过投行、基金圈子的帅哥就会知道,周受资的这种魅力就是从小良好教育+后天职业环境养成的,撇开五官天生优质不谈,从皮肤、牙齿和身材也能看出来他很重视自我管理。”“这种受过良好教育、外表出色、头脑好的男性,放到任何一个国家的文化环境里都是非常吃香的吧,更别提他还是个超赚钱的科技巨头的CEO。”


网红饭碗保卫战

的确,和我们熟悉的那些科技创业大佬不同,周受资待人处事的风格更像一个“金牌打工人”。在以努力着称的雷军麾下时,他也一直保持低调努力的作风,IPO时将自己见过的1500位投资者一一记在表格上,雷军评价他“有一种对世界复仇一般的勤奋”。而到了需要抛头露面和年轻人打交道的TikTok,周受资就像换了一个人,清空了推特、领英等其他社交平台内容,专注在TikTok更新生活日常。 看球赛、演唱会、吃美食、看展览,几乎没有任何工作内容,他打造了一个亲民的人设。国会问询结束回到公司,他还在片中和同事们开玩笑:“你想这么做吗?Yes or No?”还特地录了一段片,感谢粉丝们的支持。TikTok在美国的影响力惊人,在年轻人中非常风靡,相比Twitter、YouTube、Facebook,这里有着更轻鬆的网络环境。当然也有家长觉得这种无脑短片“害人”,这些论调我们很熟悉。 另一件不得不提的事实是,在经济衰退的环境中,TikTok依然养活了一大批美国人,从网红到零售商、广告商,至少500万商家在靠它谋生。该平台第一大网红Charli D'Amelio粉丝数高达1.5亿,姐姐Dixie也有5700万粉丝,两人以舞蹈和歌曲走红。2021年Charli只有17岁时,年收入已经达到了1750万美元(人民币1.1亿),超过麦当劳CEO当年年薪。 而在金字塔的腰部以下,也有大量小网红在靠短片营生。万粉以上的博主一条广告平均就能收入1105美元,百万以上博主的广告均价则在6000美元以上。“这些七老八十的政府老爷们,用都没用过TikTok,问的问题都好滑稽。”有用户这样说道。 “他们甚至想证明『软件能连wifi,所以你们在偷美国人的数据』。”一位博主在她的周受资应援片中加上了一个硕大的标题:“这个app单枪匹马阻止了经济衰退,你们为什么要搞它?” 有些粉丝在犯花痴,有些网友在跟风,而那些靠它赚钱的人其实很明白——挺周受资挺TikTok,图的不是别的,是保卫自己的饭碗。

2023股市面临巨大风险,关注“一级市场”投资机会


我们特别邀请了中国第一个私人银行(北京商业银行)的发起人 - John Wang为我们一对一解析一级市场投资机会和风险 “一级市场”投资研讨,不对公众开放,仅限“实名”认证的注册会员


加入方式: 1, 微信: Vandave 2, WhatsApp: 604-7227628 3, 视频号: 时空“资升堂”联系在线客服


风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

ree
ree

免责声明

文章内容不代表本网站立场。 如有争议,请随时联系我们!


扫码关注我们吧

微信公众号|温渡传媒

资深媒体人|华美嘉

社群运营 · 融媒制作

公关策划 · 活动推广

ree

商务合作:1-778-707-5568

Email:vandomediacorp@gm

ail.com

YouTuBe:https://www.youtube.com/vandomedia

Instagram:VandoMedia

Facebook:https://www.facebook.com/reneezhao716VOA




 
 

All Videos

All Videos

All Videos
脑动才精: 《大科技蓝筹回调,小盘股鸡飞狗跳,回调即将来临?; 美国经济靠AI还能撑多久?》

脑动才精: 《大科技蓝筹回调,小盘股鸡飞狗跳,回调即将来临?; 美国经济靠AI还能撑多久?》

01:10:32
《黑天鹅未至,金发姑娘行情依旧?》个股分析: CRWV,CRCL, ORCL,GOOG。。。。

《黑天鹅未至,金发姑娘行情依旧?》个股分析: CRWV,CRCL, ORCL,GOOG。。。。

01:11:34
《四大股指同时冲击光明顶; - Gap Out  - ; 九月魔咒阴影下我的思考》

《四大股指同时冲击光明顶; - Gap Out - ; 九月魔咒阴影下我的思考》

01:10:03
Banner1
bottom of page