有关实现类人的(zeroshot)图像CV和无人自动驾驶的猜想-第二版

九是否随意的称呼:有关实现类人的(zeroshut)图像CV和无人自动驾驶的猜想

有关无人自动驾驶,本人虽然是视觉领域CV的相关从业者,但是并没有从事自动驾驶工作的经历,所以各位看官看看就好,别当真也别较真,真想了解的可以找国内外相关领域的专家和学者来咨询。

有人说zeroshot才对,不是zeroshut,修改过来了的。

之前吹大了,这牛吹的贼鸡儿那个,但是没有相应的codes,确实挺那个的,所以啊,talk is cheap, show me the code,才是正确的。说着说着感觉自己像是产品经理了,但实际上动动嘴皮子还是挺simple的,但是怎么实现就挺难了,不过这个要是这么容易实现,生而为人我很容易?what the god?目前的话本人也不知道怎么实现这个。所以啊,确实挺难的呢。

虽然talk is cheap,但不知道怎么实现的情况下,通过talk来理清具体的si路也是好的,可能很多废话哦,但是能帮助我理清思路的。

第一版提到了眼睛,也就是世界上绝大多数的人,都是通过眼睛来认识世界的,眼睛的每一次移动,眼球的每一次聚焦,都是一次前向传播,也就是一次forward,眼球不停的移动,不停的聚焦,也就是很多次的前向传播。不过人们不会感觉到停顿,也就是前向传播是不停歇的,并没有停止的时候,所以,大脑处理数据是Continuous的,也就是前向传播没有停止过。可能眼睛输入的数据就是Continuous的。所以真的是continuous么,不知道???。不过人们感觉到没有停顿,主要还是只有在前向传播的时候才会感觉。

闪电侠

通过闪电侠这部电视剧,可以让人们知道,其实人类日常生活中的各种动作都是很慢的,本人看一页的时间,可能闪电侠已经看完了10本书了,也就是说闪电侠神经电流的速度相当fast,前向传播的速度很快,常人前向传播1页,闪电侠可以前向传播10本书。那么若是当前的chatgpt前向传播速度快10倍,那么反应速度也能快10倍。

电流的速度是光速,大脑神经电流的速度达不到光速,若是人类的神经电流的速度可以达到当前的两倍,那么人类的反应速度可以快2倍,若是能达到10倍,人类的反应速度可以快10倍,那个时候猫咪也不是我的对手,以前养过很多只猫,加上生的崽,可能有几十只,毕竟这些崽也是养大的,被猫咪的还我猫猫拳揍过很多次,只要我的神经电流速度快10倍,那么猫咪的还我猫猫拳也不是我的对手,可以很轻松的抵挡住猫咪的攻击,那个时候就是我调戏猫咪了。

说这些其实就是,人类的神经电流速度是存在上限的,所以前向传播是需要时间的,那么前向传播不存在的时候,人类还有意识么,人类的意识存在于前向传播期间?还是存在于每时每刻?

猫的反应速度是人的七倍

人们都说猫的反应速度很快,可能是猫的体型小导致的,体型小导致了神经元神经束短,电流经过的距离短,所以神经电流传播的时间短,而且猫的脑袋小,脑容量比较小的,需要经过的神经数量少,传播的距离短,电流经过的总距离短,所以前向传播需要的时间短。总而言之就是,猫咪从发出神经电流信号,到大脑处理完神经信号电流,最后传出神经信号电流,神经电流经过的距离比较短,花费的时间比较少,所以才会出现猫的反应速度比人快。

人的脑容量很大,神经束很长,神经电流需要流经的距离也很长,所以人类的反应速度比猫要慢的。

意识存在的时间段

让AI或者GPT具有人类的意识甚至beyond变到AGI - 知乎 (zhihu.com)

这个文篇内提到了意识,大脑类比做模型的话,那么意识就是模型的输入和输出,或者说意识就是模型本身。那么人类的意识什么时候存在,什么时候不存在呢?人类前向传播的时候,意识是存在的,那么没有前向传播的时候,人类还有意识么?

睡觉的时候,人类基本是没有意识的,因为这个时候,大脑关闭了各种传感器的输入,肌肉变得松弛了,也就是四肢的传感器也关闭了,听觉视觉触觉,这些传感器关闭以后,大脑也就没有了输入,可以说人没有意识了。

盲人感知到的世界

chatgpt是没有眼睛的,看不到,和盲人还是类似的,所以,这里用盲人来类比。

下面先不提眼睛了,我们来看看盲人的世界,盲人的眼睛是不能正常使用的,所以只能通过手来感知世界,通过耳朵来感知声音。盲人摸象的故事大家都知道,每个盲人都是用手来摸大象的,不同的盲人给出的答案都不相同。这个时候盲人的大脑接收到的数据,是从手上传来的,盲人A只摸了大象的鼻子,盲人b只摸了大象的腿,盲人c只摸了大象的脑袋,盲人K只摸了大象的背部,盲人H只摸了大象的肚皮。

每个盲人都描绘了不同的大象,这些其实都是大象的一部分特征,每个盲人相当于一个特征提取器,都只提取了一部分特征,只有汇总所有的特征以后,才能形成完整的大象,而且还需要位置信息,光拿到特征还不够的,还需要所有特征的位置信息,才能最终得到大象的完整图像。

所以盲人摸象,每个盲人提取到了不同的特征,每个盲人拿到了不同位置的特征。

模型

人类的大脑,若是神经元决定不继续传播,电压会变到0然后电流会停止的,但是现在的模型,其实很多权重都是0,但还是需要计算,很多计算都是不必要的,毕竟权重都是0的话,那么也就没必要继续传播了的