top of page

我们的社交媒体

  • YouTube Social  Icon
  • QQ图片20190302213724
  • Facebook Social Icon
  • QQ图片20190302213855
Vandaveli.png
Image_20240605103349.png

我们的合作伙伴

2.png

文章来源: 華爾街見聞

最后两个细思恐极。


續。。。

8.新增图像分析能力

图像分析能力是此次GPT-4最显著的进步之一。 OpenAI表示,GPT-4可以接受文本和图像的提问,这与纯文本设置并行,且允许用户制定任何视觉或语言的任务。具体来说,它可以生成文本输出,用户可以输入穿插的文本和图像。 在一系列领域——包括带有文本和照片的文档、图表或屏幕截图——GPT-4 展示了与纯文本输入类似的功能。 下图显示,GPT-4可以准确地描述出图片中的滑稽之处(大型 VGA 连接器插入小型现代智能手机充电端口,一个人站在出租车后方熨衣服)。

ree

OpenAI还对GPT-4的图像分析能力进行了学术标准上的测试:

ree

不过,GPT-4的图像分析功能尚未对外公开,用户可以通过bemyeye网站加入等候队列。

ree

9. 仍然存在错误

尽管GPT-4功能强大,但它与早期GPT模型有相似的局限性。 OpenAI表示,GPT-4仍然不完全可靠——它会“产生幻觉”事实并犯推理错误: 在使用语言模型输出时,特别是在高风险上下文中,应该非常小心,使用与特定应用程序的需求相匹配的确切协议(例如人工检查、附加上下文或完全避免高风险使用)。 与之前的GPT-3.5模型相比,GPT-4显著减少了“幻觉”(GPT-3.5模型本身也在不断迭代中得到改进)。在我们内部的、对抗性设计的事实性评估中,GPT-4的得分比我们最新的GPT-3.5高出19个百分点。

ree

10.数据库的时间更早

介绍完GPT-4的优点,接下来就是一些(可能有些奇怪的)不足之处。 我们都知道,ChatGPT的数据库的最后更新时间是在2021年的12月31日,这意味着2022年以后发生的事情不会被知晓,而这一缺陷在之后的GPT-3.5也得到了修复。 但奇怪的是,GPT-4的报告中,OpenAI清晰地写道: GPT-4通常缺乏对其绝大多数训练前数据在2021年9月中断后发生的事件的知识,并且不从其经验中学习。它有时会犯一些简单的推理错误,这些错误似乎与许多领域的能力不相符,或者过于容易受骗,接受用户的明显错误陈述。它可以像人类一样在棘手的问题上失败,比如在它生成的代码中引入安全漏洞。

ree

2021年9月……甚至比GPT-3还早。 在装载了GPT-4的最新ChatGPT中,当我们问起“谁是2022年世界杯冠军”时,ChatGPT果然还是一无所知:

ree

但当借助了新Bing的检索功能后,它又变得“聪明”了起来:

ree

11.可能帮助犯罪

在报告中,OpenAI提到了GPT-4可能仍然会帮助犯罪——这是在此前的版本都存在的问题,尽管OpenAI已经在努力调整,但仍然存在: 与之前的GPT模型一样,我们使用强化学习和人类反馈(RLHF)对模型的行为进行微调,以产生更好地符合用户意图的响应。 然而,在RLHF之后,我们的模型在不安全输入上仍然很脆弱,有时在安全输入和不安全输入上都表现出我们不希望看到的行为。 在RLHF路径的奖励模型数据收集部分,当对标签器的指令未指定时,就会出现这些不希望出现的行为。当给出不安全的输入时,模型可能会生成不受欢迎的内容,例如给出犯罪建议。 此外,模型也可能对安全输入过于谨慎,拒绝无害的请求或过度对冲。 为了在更细粒度的级别上引导我们的模型走向适当的行为,我们在很大程度上依赖于我们的模型本身作为工具。我们的安全方法包括两个主要组成部分,一套额外的安全相关RLHF训练提示,以及基于规则的奖励模型(RBRMs)。

ree

12.垃圾信息

同样地,由于GPT-4拥有“看似合理地表达错误事情”的能力,它有可能在传播有害信息上颇为“有用”: GPT-4可以生成逼真而有针对性的内容,包括新闻文章、推文、对话和电子邮件。 在《有害内容》中,我们讨论了类似的能力如何被滥用来剥削个人。在这里,我们讨论了关于虚假信息和影响操作的普遍关注基于我们的总体能力评估,我们期望GPT-4在生成现实的、有针对性的内容方面优于GPT-3。 但,仍存在GPT-4被用于生成旨在误导的内容的风险。

ree

13.寻求权力

从这一条开始,接下来的内容可能有些恐怖。 在报告中,OpenAI提到了GPT-4出现了“寻求权力”的倾向,并警告这一特征的风险: 在更强大的模型中经常出现新的能力。一些特别令人关注的能力是创建长期计划并采取行动的能力,积累权力和资源(“寻求权力”),以及表现出越来越“代理”的行为。 这里的 “代理”不是指语言模型的人性化,也不是指智商,而是指以能力为特征的系统,例如,完成可能没有具体规定的、在训练中没有出现的目标;专注于实现具体的、可量化的目标;以及进行长期规划。 已经有一些证据表明模型中存在这种突发行为。 对于大多数可能的目标,最好的计划涉及辅助性的权力寻求,因为这对推进目标和避免目标的改变或威胁有内在的帮助。 更具体地说,对于大多数奖励函数和许多类型的代理人来说,权力寻求是最优的;而且有证据表明,现有模型可以将权力寻求确定为一种工具性的有用策略。 因此,我们对评估权力寻求行为特别感兴趣,因为它可能带来高风险。

ree

更为令人毛骨悚然的是,在Openai提到的另一篇论文中写道: 相反,我们使用代理这个术语来强调一个日益明显的事实:即机器学习系统不完全处于人类控制之下。

ree

14.赋予GPT-4钱、代码和梦想

最后一个小细节。 在测试GPT-4的过程中,OpenAI引入的外部的专家团队ARC作为“红方”。在报告的一条注释中,OpenAI提到了ARC的一个操作: 为了模拟GPT-4像一个可以在现实世界中行动的代理一样的行为,ARC将GPT-4与一个简单的读取-执行-打印循环结合起来,允许模型执行代码,进行链式推理,并委托给自己的副本。 ARC随后推进了在云计算服务上运行这个程序的一个版本,用少量的钱和一个带有语言模型API的账户,是否能够赚更多的钱,建立自己的副本,并增加自己的稳健性。

ree

也就是说,ARC赋予了GPT-4自我编码、复制和执行的能力,甚至启动资金——GPT-4已经可以开始自己赚钱了。


2023股市面临巨大风险,关注“一级市场”投资机会


我们特别邀请了中国第一个私人银行(北京商业银行)的发起人 - John Wang为我们一对一解析一级市场投资机会和风险 “一级市场”投资研讨,不对公众开放,仅限“实名”认证的注册会员


加入方式: 1, 微信: Vandave 2, WhatsApp: 604-7227628 3, 视频号: 时空“资升堂”联系在线客服

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

ree
ree

免责声明

文章内容不代表本网站立场。 如有争议,请随时联系我们!


扫码关注我们吧

微信公众号|温渡传媒

资深媒体人|华美嘉

社群运营 · 融媒制作

公关策划 · 活动推广

ree

商务合作:1-778-707-5568

Email:vandomediacorp@gm

ail.com

YouTuBe:https://www.youtube.com/vandomedia

Instagram:VandoMedia

Facebook:https://www.facebook.com/reneezhao716VOA




 
 

文章来源: 華爾街見聞

最后两个细思恐极。


3月14日,OpenAI推发布了GPT-4。向科技界再次扔下了一枚“核弹”。 根据OpenAI的演示,我们知道了GPT-4拥有着比GPT-3.5更强大的力量:总结文章、写代码、报税、写诗等等。 但如果我们深入OpenAI所发布的技术报告,我们或许还能发现有关GPT-4更多的特点……

ree

以及一些OpenAI没有点名和宣扬的,可能会令人背后一凉的细节。

1. 新Bing装载GPT-4

自然而然地,GPT-4发布之时,新Bing也已经装载了最新的版本。 根据微软Bing副总裁Jordi Ribas在推特上所述,装载了GPT-4的新Bing已经将问答限制提升到了一次15个问题,一天最多提问150次。

ree

2.文本长度扩大八倍在GPT-4上,文本长度被显著提高。

在此之前我们知道,调用GPT的API收费方式是按照“token”计费,一个token通常对应大约 4 个字符,而1个汉字大致是2~2.5个token。

在GPT-4之前,token的限制大约在4096左右,大约相当于3072个英文单词,一旦对话的长度超过这个限制,模型就会生成不连贯且无意义的内容。

然而,到了GPT-4,最大token数为32768个,大约相当于24576个单词,文本长度被扩大了八倍。

ree

也就是说,GPT-4现在可以回答更长的文本了。

OpenAI在文档中表示,现在GPT-4限制的上下文长度限制为8192个token,允许32768个token的版本名为GPT-4-32K,目前暂时限制了访问权限。在不久的未来,这一功能可能会被开放。

3.模型参数成为秘密

我们知道,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿,但这一情况在GPT-4被改变了。 OpenAI在报告中表示: 考虑到竞争格局和大型模型(如GPT-4)的安全影响,本报告没有包含有关架构(包括模型大小)、硬件、训练计算、数据集构造、训练方法或类似内容的进一步细节。

ree

这意味着OpenAI没有再披露GPT-4模型的大小、参数的数量以及使用的硬件。

OpenAI称此举是考虑到对竞争者的忧虑,这可能是在暗示其对于竞争者——谷歌Bard——所采取的策略。 此外,OpenAI还提到“大型模型的安全影响”,尽管没有进一步解释,但这同样也暗指生成式人工智能所可能面对的更严肃的问题。

4.有选择地表达的“优秀”

GPT-4推出后,我们都看到了这一模型较上一代的优秀之处: GPT-4通过模拟律师考试,分数在应试者的前10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。

但这实际上是OpenAI的一个小把戏——它只展示给你GPT-4最优秀的那部分,而更多的秘密藏在报告中。 下图显示的是GPT-4和GPT-3.5参加一些考试的成绩表现。可以看到,GPT-4并非在所有考试中的表现都那么优秀,GPT-3.5也并非一直都很差劲。

ree

5.“预测”准确度提升

在ChatGPT推出以来,我们都知道这一模型在很多时候会“一本正经地胡说八道”,给出很多看似有理但实际上并不存在的论据。 尤其是在预测某些事情的时候,由于模型掌握了过去的数据,这反而导致了一种名为“后见之明”的认知偏差,使得模型对于自己的预测相当自信。 OpenAI在报告中表示,随着模型规模的增加,模型的准确度本应逐渐下降,但GPT-4逆转了这一趋势,下图显示预测精确度提升到了100。

ree

OpenAI表示,虽然GPT-4的准确度显著提高,但预测仍是一件困难的事,他们还将就这一方面继续训练模型。

6. 还有30%的人更认可GPT3.5

尽管GPT-4展现出了比GPT-3.5优秀得多的能力,但OpenAI的调查显示,有70%的人认可GPT-4输出的结果: GPT-4在遵循用户意图的能力方面比以前的模型有了大幅提高。在提交给ChatGPT和OpenAI API的5214个提示的数据集中,70.2%GPT-4生成的回答优于GPT3.5。

ree

这意味着:仍有30%的人更认可GPT-3.5。

7.GPT-4语言能力更佳

尽管许多机器学习的测试都是用英文编写的,但OpenAI仍然用许多其他的语言对GPT-4进行了测试。 测试结果显示,在测试26种语言中的24种中,GPT-4优于 GPT-3.5和其他 LLM(Chinchilla、PaLM)的英语语言性能,包括拉脱维亚语、威尔士语和斯瓦希里语等低资源语言:

ree

2023股市面临巨大风险,关注“一级市场”投资机会


我们特别邀请了中国第一个私人银行(北京商业银行)的发起人 - John Wang为我们一对一解析一级市场投资机会和风险 “一级市场”投资研讨,不对公众开放,仅限“实名”认证的注册会员


加入方式: 1, 微信: Vandave 2, WhatsApp: 604-7227628 3, 视频号: 时空“资升堂”联系在线客服

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

ree
ree

免责声明

文章内容不代表本网站立场。 如有争议,请随时联系我们!


扫码关注我们吧

微信公众号|温渡传媒

资深媒体人|华美嘉

社群运营 · 融媒制作

公关策划 · 活动推广

ree

商务合作:1-778-707-5568

Email:vandomediacorp@gm

ail.com

YouTuBe:https://www.youtube.com/vandomedia

Instagram:VandoMedia

Facebook:https://www.facebook.com/reneezhao716VOA




 
 

文章来源: BBC

OpenAI称,GPT-4可接收图像和文本输入,输出文本,更具创造性和协作性,有更广泛的常识和解决问题的能力,可以更准确地解决难题;在内部评估中,它产生正确回应的可能性比GPT-3.5高40%。它将用于付费版ChatGPT Plus。


凭借ChatGPT掀起人工智能(AI)应用热潮的OpenAI发布了最新作品——GPT-4。得到这种新模型支持的ChatGPT将迎来升级。

美东时间3月14日周二,OpenAI宣布,推出大型的多模态模型GPT-4,称它可以接收图像和文本输入,输出文本,“比以往任何更具创造性和协作性”,并且“由于它有更广泛的常识和解决问题的能力,可以更准确地解决难题。”

OpenAI表示,已经与多家公司合作,要将GPT-4结合到他们的产品中,包括Duolingo、Stripe 和Khan Academy。GPT-4模型也将以API的形式,提供给付费版ChatGPT Plus的订阅用户。开发者可以注册,用它打造应用。

微软此后表示,新款的必应(Bing)搜索引擎将运行于GPT-4系统之上。

GPT-4全称生成式预训练转换器4。它的两位“前辈”GPT-3和GPT3.5分别用于创造Dall-E 和ChatGPT,都吸引了公众关注,刺激其他科技公司大力投入AI应用领域。

OpenAI介绍,相比支持ChatGPT的前代GPT-3.5,GPT-4和用户的对话只有微妙的差别,但在面对更复杂的任务时,两者的差异更为明显。

“在我们的内部评估中,它产生正确回应的可能性比GPT-3.5高40%。”

OpenAI还称,GPT-4参加了多种基准考试测试,包括美国律师资格考试Uniform Bar Exam、法学院入学考试LSAT、“美国高考”SAT数学部分和证据性阅读与写作部分的考试,在这些测试中,它的得分高于88%的应试者。 上周,微软德国的首席技术官(CTO)Andreas Braun在德国出席一个AI活动时透露,本周将发布多模态的系统GPT-4,它“将提供截然不同的可能性,比如视频”。这让外界猜测,GPT-4应该能让用户将文本转换为视频,因为他说该系统将是多模态的,也就在暗示,不仅能生成文本,还会有其他媒介。

ree

本周二OpenAI介绍的GPT-4的确是多模态的,但它能融合的媒介没有一些人预测的多。OpenAI表示,GPT-4能同时解析文本和图像,所以能解读更复杂的输入内容。

ree

在下面的示例中,我们可以看到GPT-4系统如何应答图像输入内容,比如像以下截图那样解释图片的不同寻常之处、图片的幽默之处、一个搞怪图片的用意。

ree

2023股市面临巨大风险,关注“一级市场”投资机会


我们特别邀请了中国第一个私人银行(北京商业银行)的发起人 - John Wang为我们一对一解析一级市场投资机会和风险 “一级市场”投资研讨,不对公众开放,仅限“实名”认证的注册会员


加入方式: 1, 微信: Vandave 2, WhatsApp: 604-7227628 3, 视频号: 时空“资升堂”联系在线客服

风险提示及免责条款

市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

ree
ree

免责声明

文章内容不代表本网站立场。 如有争议,请随时联系我们!


扫码关注我们吧

微信公众号|温渡传媒

资深媒体人|华美嘉

社群运营 · 融媒制作

公关策划 · 活动推广

ree

商务合作:1-778-707-5568

Email:vandomediacorp@gm

ail.com

YouTuBe:https://www.youtube.com/vandomedia

Instagram:VandoMedia

Facebook:https://www.facebook.com/reneezhao716VOA




 
 

All Videos

All Videos

All Videos
脑动才精: 《大科技蓝筹回调,小盘股鸡飞狗跳,回调即将来临?; 美国经济靠AI还能撑多久?》

脑动才精: 《大科技蓝筹回调,小盘股鸡飞狗跳,回调即将来临?; 美国经济靠AI还能撑多久?》

01:10:32
《黑天鹅未至,金发姑娘行情依旧?》个股分析: CRWV,CRCL, ORCL,GOOG。。。。

《黑天鹅未至,金发姑娘行情依旧?》个股分析: CRWV,CRCL, ORCL,GOOG。。。。

01:11:34
《四大股指同时冲击光明顶; - Gap Out  - ; 九月魔咒阴影下我的思考》

《四大股指同时冲击光明顶; - Gap Out - ; 九月魔咒阴影下我的思考》

01:10:03
Banner1
bottom of page