随笔 - 934, 文章 - 0, 评论 - 247, 阅读 - 344万

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

随笔分类 -  机器学习

摘要:https://github.com/lvwzhen/law-cn-ai 把开源的中国法律法规数据(https://github.com/LawRefBook/Laws)向量化,然后接入ChatGPT,这样你就可以用自然语言对法律法规进行问答。下面是问答的效果: 对于一些复杂的案例场景,回答还是不行 阅读全文

posted @ 2023-04-29 08:01 蝈蝈俊 阅读(398) 评论(0) 推荐(0) 编辑

摘要:Auto-GPT是个神奇的工具,它能够根据您用自然语言描述的目标,使用GPT做深入分析,拆分为多个有顺的子任务,并自动执行诸如访问互联网等任务操作,然后根据执行结果做反思重新优化目标,整个过程不断自主循环,直到给出满意的结果。 特点: 不需要人类插手,我们使用ChatGPT,每项任务需要手动发起;而 阅读全文

posted @ 2023-04-25 04:53 蝈蝈俊 阅读(1132) 评论(0) 推荐(0) 编辑

摘要:"思维链"(Chain of Thought)是指一系列有逻辑关系的思考步骤或想法,这些步骤或想法相互连接,形成了一个完整的思考过程。它是指导我们思考和解决问题的一种方法,可以帮助我们更好地理解问题、分析问题和解决问题。 一个有效的思维链应该具有以下特点: 逻辑性:思维链中的每个思考步骤都应该是有逻 阅读全文

posted @ 2023-04-13 15:14 蝈蝈俊 阅读(1877) 评论(0) 推荐(0) 编辑

摘要:ChatGPT是一个语言模型,而不是知识模型。 当我们觉得ChatGPT在胡说八道时,实际上是把它误认为知识模型,当认知为知识模型时,就不能出错,不能胡说八道。 事实上,GPT不可能获得完整的知识,无论技术如何发展,知识错误是必然会出现的,这是因为: 部分知识具有时效性,从GPT训练的周期来看,它的 阅读全文

posted @ 2023-04-09 20:55 蝈蝈俊 阅读(82) 评论(0) 推荐(0) 编辑

摘要:ChatGPT太强了,让人觉得AI可以应用于所有行业,重新塑造它们。 但是,我们如何判断哪些行业或场景更适合使用AI?有什么方法论可以指导我们判断呢? 一个最主要的方法论应该是成本结构分析。 这里的成本结构是要看AIGC替代原先工作后,可优化的成本占原先总成本的比重。 如果只能降低10%~20%,不 阅读全文

posted @ 2023-04-08 22:09 蝈蝈俊 阅读(151) 评论(0) 推荐(0) 编辑

摘要:受人类大脑内部复杂的神经元网络的启发,深度学习模拟生物神经网络,构建出包括输入层和输出层在内的人工神经网络。 下图,左边是视觉系统大致的通路,信息从视网膜到LGN的大细胞层到脑皮层;中间是听觉皮层,信息从耳蜗一直传到听觉皮层;右边是典型的人工神经网络。以上三种均属于层次化的结构。 当将数据输入该网络 阅读全文

posted @ 2023-04-08 07:12 蝈蝈俊 阅读(153) 评论(0) 推荐(0) 编辑

摘要:Edge的最新版本集成了NewBing的搜索聊天功能,可以很方便的基于某个网页或内容进行聊天,如下图所示: 要讨论的内容是本地的文件也可以: 使用注意点: Edge 请用Dev的最新版本。 需要FQ,国内的bing不支持new bing(https://www.bing.com/new); 快速阅读 阅读全文

posted @ 2023-04-05 15:16 蝈蝈俊 阅读(947) 评论(0) 推荐(0) 编辑

摘要:在上一篇文章中,介绍了卷积神经网络(CNN),CNN在图像识别中有着强大、广泛的应用,但有一些场景用CNN却无法得到有效地解决,例如: 语音识别,要按顺序处理每一帧的声音信息,有些结果需要根据上下文进行识别; 自然语言处理,要依次读取各个单词,识别某段文字的语义; 这些场景都有一个特点,就是都与时间 阅读全文

posted @ 2023-04-05 06:53 蝈蝈俊 阅读(118) 评论(0) 推荐(0) 编辑

摘要:生成对抗网络(Generative Adversarial Nets 简写GAN)是最近几年很热门的一种无监督算法,他能生成出非常逼真的照片,图像甚至视频。它由2个重要的部分构成: 生成器(Generator):通过机器生成数据(大部分情况下是图像),目的是“骗过”判别器; 判别器(Discrimi 阅读全文

posted @ 2023-04-05 06:50 蝈蝈俊 阅读(249) 评论(0) 推荐(0) 编辑

摘要:引言:上周听了刘嘉老师的分享,越来越认可看懂人工智能需要从脑科学的角度去思考,基于分享的内容、自己的思考、收集的资料整理出本篇文章。 惊艳出现的ChatGPT还在被大家吐槽“胡说八道”,到GTP-4时,一下就从后10%的差生变成了前10%的尖子生,让大家都在问: 到底人工智能发生什么了?为什么现在突 阅读全文

posted @ 2023-03-23 15:46 蝈蝈俊 阅读(487) 评论(0) 推荐(0) 编辑

摘要:ChatGPT引发了AI革命,大家都想探究如何让它发挥更大价值。 以它为代表的大模型并未完全掌握所有专业知识,这也正是我们创业的契机。 我们应该思考如何让AI在专业领域中释放更大的价值潜能。 就像开发者挖掘出某个鲜为人知的资源一样,我们可以开发出AI在特定领域的潜力,从而在市场上脱颖而出。 以Ope 阅读全文

posted @ 2023-03-20 15:03 蝈蝈俊 阅读(2533) 评论(0) 推荐(0) 编辑

摘要:《联邦党人文集》 1787年5月,美国各州(当时为13个)代表在费城召开制宪会议;1787年9月,美国的宪法草案被分发到各州进行讨论。一批反对派以“反联邦主义者”为笔名,发表了大量文章对该草案提出批评。 宪法起草人之一亚历山大·汉密尔顿着急了,他找到曾任外交国务秘书(即后来的国务卿)的约翰·杰伊,以 阅读全文

posted @ 2023-03-06 21:32 蝈蝈俊 阅读(176) 评论(0) 推荐(0) 编辑

摘要:作为当时美国海军大西洋舰队的19艘核动力攻击潜艇之一,排水量3000吨的天蝎号属于飞鱼级核潜艇。为了最大限度的提升水下速度,该艇采用了先进的泪滴形外壳,以33节(每小时61公里)的水下速度,成为当时美国海军最快的核潜艇。 1968年5月,美国海军的天蝎号核潜艇在大西洋亚速海海域突然失踪,潜艇和艇上的 阅读全文

posted @ 2023-03-06 21:01 蝈蝈俊 阅读(867) 评论(0) 推荐(0) 编辑

摘要:在用matplotlib进行绘图时,如果在绘制过程中会用到中文,则默认情况下会出现字体警告: UserWarning: Glyph 36724 (\N{CJK UNIFIED IDEOGRAPH-8F74}) missing from current font. 警告信息中提示“missing fr 阅读全文

posted @ 2023-03-05 10:10 蝈蝈俊 阅读(2388) 评论(0) 推荐(0) 编辑

摘要:提到token,不得不提tokenization(分词)。分词就是将句子、段落、文章这类型的长文本,分解为以字词(token)为单位的数据结构。 比方说,在句子 “我很开心” 中,利用中文分词得到的列表是{“我”,“很”,“开心”},列表中的每一个元素代表一个token。 不同的分词策略,会导致不同 阅读全文

posted @ 2023-03-04 07:48 蝈蝈俊 阅读(4641) 评论(0) 推荐(1) 编辑

摘要:目的:跑通下面代码 相关代码 from torch import nn import torch import jieba import numpy as np raw_text = """越努力就越幸运""" words = list(jieba.cut(raw_text)) print(word 阅读全文

posted @ 2023-03-02 08:40 蝈蝈俊 阅读(52) 评论(0) 推荐(0) 编辑

摘要:嵌入(Embedding)是用向量表示一个物体,这里所说的物体可以是人,是实体,是虚拟物品,比如:一个单词、一条语句、一个序列、一件商品、一个动作、一本书、一部电影、一个人等等。 可以说嵌入涉及机器学习、深度学习的绝大部分对象,这些对象是机器学习和深度学习中最基本、最常用、最重要的对象,正因如此,如 阅读全文

posted @ 2023-03-01 10:45 蝈蝈俊 阅读(4607) 评论(1) 推荐(0) 编辑

摘要:在Encoder-Decoder模型框架我们提到: 不论输入和输出的语句长度是什么,中间的上下文向量长度都是固定的。 一旦长度过长,仅仅靠一个固定长度的上下文向量解码,会有信息瓶颈,可能会丢失信息的问题。 解决方法就是注意力机制。 在了解注意力机制之前,先请看《圣母与圣吉凡尼诺》这幅由佛罗伦萨画家多 阅读全文

posted @ 2023-02-26 20:02 蝈蝈俊 阅读(325) 评论(0) 推荐(0) 编辑

摘要:Seq2Seq(Sequence-to-Sequence,序列到序列)问题是一类特殊的序列建模问题,其中的Encoder和Decoder都是一个序列。 Encoder-Decoder模型框架(编码器-解码器模型框架)最早在2014年提出,当时是为了解决机器翻译的问题(机器翻译就是一个典型的Seq2S 阅读全文

posted @ 2023-02-24 22:03 蝈蝈俊 阅读(2596) 评论(1) 推荐(0) 编辑

摘要:在当下各行各业,同质化算是一个很普遍的问题,与“同质化”对应的词,便是“差异化”。差异化是指企业在顾客广泛重视的某些方面,力求在本产业中独树一帜。 “差异化”并非可有可无,而是生存之道 如果无视“差异化”的影响,盲目投身于同质化的竞争之中,同时成本又比不过对手,必然会撞个头破血流。 知乎上一位网友表 阅读全文

posted @ 2023-02-22 10:47 蝈蝈俊 阅读(37) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示