标题: [转载]计算机的碎片---管凤琴(马慧元) [打印本页]
作者: 杜欣欣 时间: 2006-7-25 11:31 标题: [转载]计算机的碎片---管凤琴(马慧元)
都是写着玩的,很不严密。逗乐而已。:)www.coastidebbs.com
***依我看,GEB缺了重要的内容。如果我写,定要加上美国诗人Wallace Stevens,那更是对世界的拓朴式解构了,赤裸裸的循环递归迭代,把信仰都绕进去了。WS喜欢写“一个基督徒女人”这种题目,更喜欢慢条斯理地细细数来“十三种方式看黑鸟”,喜欢追究“存在”,“记忆”,“消失”,注意,在我看来,这些理念都“后计算机”得不得了,而且自己丁丁当当搭起概念集合的架子。而且,他的诗意是放射性的,从语词中心出发,从那些华丽怪诞的动物名或者地名出发,最后形成凸多边形----是凸的,不包括弯弯的蚕豆那样的形状。因为WS真的很自我。 www.coastidebbs.com
***说个笑话,是我给过去的导师讲的,受到他的赏识。:)www.coastidebbs.com
我说你要给学生讲无穷小概念,或者极限,就问学生个问题:什么东西比蚂蚁的嘴小?老师看着我发楞,我在黑板上画了只虫子,然后写上 the thing it eats. 也就是说,不管多小的东西,它吃的零食肯定比它小。这个命题是可以用集合语言来写的:给定一只此集合中的蚂蚁,总能找到比它的嘴小的东西,这就是“蚂蚁集合”。www.coastidebbs.com
***我们一门Data mining的课,研究如何给数据分簇。有种分法,就是随便在数据中找一个点,规定选取半径为R内的若干个邻点为一类,然后邻点当主点,各自向外扩张,直到达到终止条件。这样一开始的n个点被往外长的圆圈吃掉,最后,当初象麻子一样的数据平面剩下几个干干净净的大簇。www.coastidebbs.com
这个分法在我看来有些诗意:一沙一世界,一花一天国---沙与花在这里却是吃掉和包容世界的种子。www.coastidebbs.com
***在理论课中,涉及各种集合,然后在集合中定义语言,比如语言A吧,CoA就是A的补集。这样说来,不是A的就是CoA,那么A和CoA应该性质相反了?有趣的是,我们常常要证明这样的结论,CoA = A, 或者,CoA和A有相同的特征。www.coastidebbs.com
这样一来就好玩了,A前面那个Co,成了颗玻璃弹子,我们把它弹来弹去。为了证明,一会用CoA来代替A,那么CoA跟A就反过来,一会连续推演,用Co来取Co,这时Co象个气泡一样,推着推着突然没了。www.coastidebbs.com
当初这种证明是我的拿手好戏。以Co易A,似乎在偷换和说谎。可是这个世界真是充满镜像的,没办法。www.coastidebbs.com
要说举例,也许夫妻是一例:在家庭这个集合中,夫妻似乎相对,互补,然而他们必须有些共性。www.coastidebbs.com
***那次老师一个学生毕业,老师请我们一起去酒吧吃东西,看一个家伙穿的T恤上写着一个公式,老师突然感慨地说,咱们以后在手臂上刻个刺青,就是Beta替换定律。我说是阿,人生的真理都在那个定律中了。www.coastidebbs.com
那个宝贝Beta替换定律是这样的:前提是(Lambda x. X)Beta = X, 这是一种替换规则。Beta在这里是一种标记,表明这是在做Beta替换。www.coastidebbs.com
那么,(Lambda x。X)Beta(Lambda x.X),用整个东西替换它前面那个Copy,得出什么呢?
当然,是它自己。www.coastidebbs.com
这里输入公式不容易,我只能大概说说。我的结论是,Beta替换梆地一下短路了。这样一来,形式一下子被砍简单了。而这个短路的结果,成为整个形式系统的依据。有时花非花,雾非雾,然而有时花就是雾。www.coastidebbs.com
***抵达之谜www.coastidebbs.com
过去我们学一门很基本的理论课,其中有个context-free 语言,严格的定义我记不清了,反正经常要处理这样的字符串:比如SAS,SA**2S, (我用**表示后面是A的多少次方),要你找出字符串的规律,有时需要自己定义规律。有了规律,A可以变成AAAAA。。。AAA,无限膨胀,注意,虽然无限,决非囊括全部。www.coastidebbs.com
SA**(2n)S是永远得不出SAAAS的(n是任意自然数),不论你把n设成几。正如SA**(2n+1)S永远得不出SAAS。这就是语言的边界。直观的解释是,奇数永远不是偶数。www.coastidebbs.com
还有一种边界,就是哥德尔数给各种树型结构编码,原理是利用有序的质数相乘,这样见到一个树枝乘一个质数,大家知道质数是有序,无重复的,乘起来也没有重复,所以可以用结果来辨认不同的树结构。当然,还有别的参数。www.coastidebbs.com
哥德尔的定理中,包括一种类似“必然不相等”的结论,也就是说,一个语言的规则很可能无法抵达另一种语言,它们是不相容的,因为出发点不同。这个结论可以来证明“不可能”,因为怎样怎样,所以这个永远推导不出那个。www.coastidebbs.com
把数想成树:因为它们的“童年”不同,所以长大后永不相涉,井水不犯河水。www.coastidebbs.com
***抵达之谜 (续)www.coastidebbs.com
我们过去做关于图灵机的题目,都是什么样的呢?图灵机功能有限,给你无限长的带子,你可以读之写之,但只能写0 or 1,作为辅助,可以拿另一tape辅助,计数,比如,我在带子A上走三格,在带子B上走一格。我还可以擦掉某些已写的痕迹。而且,已写的被记住,随时可用。www.coastidebbs.com
图灵机的智商,基本就这些。人能把世界简化成这个样子,能把缤纷的变化缩成如此有限的能力,不能不说是一种奇迹。www.coastidebbs.com
除了图灵机,还有一种Finite State Machine,也是描述语言之间的抵达。什么是语言?跟定理的区别是什么?语言是一种一般规律,比如,2**n是语言,因为n可以是任意值,一个数字在不在这个语言中,只看它是否2的多少次方,至于到底是多少,随便。但定理不是,它不允许生长变化,完全是预定范围,预定前提。www.coastidebbs.com
用Finite State Machine来表示语言,也就是设计一种从此达彼的路线,是我们曾经奋斗一学期的事情。FSM是一些圆圈,中间一些线相连,表面从这里怎么去那里,一般就是字符串后面连接上0还是1。比如要用FSM表示所有被4整除的数,要研究被4整除的数变成二进制有什么规律,然后为这样的二进制字符串设计出路线---一个字符出发,中间路过0或1,都捡起来垫在屁股底下,然后越坐越高,转了一圈之后发现自己已经人模狗样,扑通一声栽进Finite State,化成语言丛中一滴水珠。www.coastidebbs.com
***本来是打算说说计算机科学的理论,但我这两天做些跟UNIX系统有关的事情,稍有所感,随便说说。这都可以是很大的话题。想到什么说什么。www.coastidebbs.com
总在想,应该探求一下,Windows/Unix (Linux)背后的哲学。这个哲学不是抽象的哲理,而仍然是人看世界的眼光。那天我的韩国朋友对我说,你们的中文很有意思,比韩文有趣,因为它体现一种哲学。我也是这样感觉的。中文的造字造词,包括种种误用通假,都微妙地联系着社会生活变迁。凡是有一定复杂度,涉及面广,成系统的东西,无不如此。www.coastidebbs.com
同理,Windows/Unix的目录结构,操作系统的思路,优先什么,把资源给什么,除了一些偶然因素(硬件限制)和商业因素,肯定能体现一种世界观,至少组织管理观念。遗憾的是,我们中国人没有参与其中,而是被动地接受了西方文化在其中的投射。这不是坏事,省得剧烈的文化撞击给应用带来不便。但遗憾的是我们真的可能错过了一些有趣的表达,一种来自古老东方传统的语言。www.coastidebbs.com
****************************************www.coastidebbs.com
过去在报纸上看到,开发Linux的那个芬兰家伙说,我们写code只为快乐。说得真好听。那是面对记者的话。写code的确可以很快乐,遗憾的是,所有老老实实的人都承认,快乐的时刻只在其中占一定百分比。现在几乎没有一个大东西可以由一个人独立完成,所以写code几乎成为工程,卖弄聪明的地方并不象别人以为的那么多。www.coastidebbs.com
那个芬兰家伙我当然很喜欢,他的快乐哲学也真鼓舞了我一阵。就好象<<小王子>>给人的鼓舞:你们大人的世界真是麻烦!我有我的玫瑰花和狐狸。www.coastidebbs.com
计算机世界其实是个大人的世界,尽管比尔盖茨的少年是那样勤奋有朝气,让人激赏。如今这个天地越来越“大人”,越来越理智,越来越社会了。www.coastidebbs.com
所以,在其中拒绝长大的人,往往赢得我最高的尊敬。不过,我们某些时候可以装得“小”一点,在名利场之外寻得一点趣味和哲学。www.coastidebbs.com
***说个笑话:www.coastidebbs.com
象我这种到处迷路的人,开车最好有人陪着才不走错路,不过即使有人陪也会迷路,就是人家告诉我去哪里哪里我也会开错,我一急总是告诫别人:不要给我说到哪条路,我只能执行汇编指令,向左向右还是直走!www.coastidebbs.com
余生也晚,没有赶上汇编盛行的年头,始终是个汇编盲。后来学某些课用到最基本的,整个目瞪口呆,死活想不明白那些数字蚂蚁搬家似的在各寄存器间LOAD来LOAD去能整出什么东东。不过至今有印象的是,由于用二进制,数字整个左移就是乘2,右移就是被2除,这个游戏规则,听上去十分拓朴。www.coastidebbs.com
***再说递归www.coastidebbs.com
递归,在parse 任何语法结构的时候,是这样的:见到第一层括号,判断是不是尽头,不是,就接着往前找,但把“不是尽头”这个信息揣在口袋里藏起来。下一步,还不是,再找,到了头之后,一下子把口袋里的信息抖落出来,变魔术一样,一层层都分离好了。www.coastidebbs.com
而反parse,即重组结构的时候,不是追索尽头,而是从一粒种子开始,寻找可能被衔接的点。被存储在数据库表中的平平展展的一行一列,其实都是秘密的树结构的枝叶。www.coastidebbs.com
还有些相互递归的函数,你中有我我中有你,一荣俱荣一损俱损,一个弄好两个都好,不然是一团乱麻。当初这种ML函数写得我们身心交瘁。www.coastidebbs.com
当初我做课题,跑到歧路上去了,因为没有好好用递归,在建立树结构的时候,保存了一枝一叶的全部信息,结果这个数据库就可怕了,越涨越大,越涨越不够。老师后来知道了,说你全想错了。他以为我会当时哭鼻子,不过我还真坚强,轻描淡写地说我再弄一个就是了嘛。然而当时我娇嫩的内心世界确实已经五内俱焚。。。www.coastidebbs.com
老师说递归一旦开始,它的进行,寻找,建立,完全是blindly的,也就是说,这个过程完全不用知道整体的信息,而是只关心前一步结果是什么,然后据此推出下一步是什么,至于以后是什么,旁边是什么,前一步的前一步,完全不管,它闭着眼睛摸黑走下去。www.coastidebbs.com
这个思路,还有ML语言那些递归为本的函数,我至今印象很深。整个关系或者语言,总的来说有三个分支,1,如果输入为空,输出为空。2。如果输入为字符,输出为字符。真实的结果,就这么两条。最后一条3,就是下一步跟前一步的关系了,调用自身,好象混凝土一样,把第一条里的“虚无”和第二条里的“种子”粘合成整个世界。www.coastidebbs.com
不得不承认,这样的思维,是一种认知哲学:把所知减到最少,驴拉磨一样。最少产生了最多----由最低能的图灵机生出计算机,由最“无知”的程序build up出人工智能。www.coastidebbs.com
***这一段是我以前写的:www.coastidebbs.com
。。。。。。。www.coastidebbs.com
既然是发明,总要带领我们突然跃上一个新平台来看世界。无论视角如何,好诗总能呈现一种自圆其说的完整观念,无论是繁还是简,是正还是邪。我们专业的理论课上有个名词,叫reduction, 原意是减少,这里是把某问题归化为另一问题,从理论上来说,解决新问题所用时间比原问题少。然而这不意味新问题更容易。听上去似乎是简化的意思,然而往往比原问题更难。这个概念我很喜欢,觉得应用在某些文学风格上也适合。比如Emily Dickinson的诗,往往是缩到极简了,可是意象却往往更丰富,也更难解。我慢慢才注意到她的清教背景(虽然她本人不是教徒) 对诗的影响。信仰本来是发扬想象力的富矿,禁欲的清教(Puritanism)更是。这个女人一生寒素(不是穷困而是贫乏) ,但在诗中昂首天外。www.coastidebbs.com
********************************************www.coastidebbs.com
Reduction是个内涵丰富的概念,大概地说,它指把某种复杂度的问题经过有限度的变化,归成同复杂度的已知问题,那么,通过那个已知的复杂度,就知道新问题的复杂度了。www.coastidebbs.com
都有哪些问题呢?我们主要讨论NP问题,也就是在多项式时间内不能解决的问题(密码技术的基本要求就是不能在多项式时间内解开),说来通俗的例子有好多,比如n个数加起来等于一个已知数,但把这n个数分成我们希望的特定样子,其实是NP-hard的。类似的问题,哈密尔顿图等等,很多,在同复杂度内可相互转换。www.coastidebbs.com
把任务分给有多个CPU的计算机,复杂度其实也很高,也是NP-Hard.我当初做题时开玩笑,说一个CPU活干得好好的,你给电脑多个CPU,它不知道怎么分配任务,活活郁闷得烧毁了。www.coastidebbs.com
这种Reduction转换,其实也体现大千世界的同一性---如果以任务复杂度的视角来看。说得无里头一些,为什么浪漫派以后的多数音乐,容易让人厌倦,是因为音乐技术复杂度(不包括歌词什么的)比巴赫时候低。解码容易解开,听着意思也就不大了。巴赫的音乐难记,所以给人“耐听”的感觉。www.coastidebbs.com
***之所以欣赏图灵的哲学,我是想起了人类其他运算工具,比如算盘。算盘跟人的直觉思维很象,而且也能做得比较快,如果使用者有很好的训练的话。还有后来风行的速算术。这些“快”,都是小聪明的,有限的加速,因为没有改变认知方式。而图灵机是不聪明的,单向的,笨得不能再笨,而正是这个模型掀起了人对“数”,对“计算”,“记忆”等等智力活动的革命。 www.coastidebbs.com
***三说递归www.coastidebbs.com
www.coastidebbs.com
www.coastidebbs.com
过去我在国内,见过一本叫做<<复杂>>的书,美国人写的,半科普半小说的东西,说的是一群博士研究生命科学,提到进化,认为以达尔文的理论,人能从无序的生命,进化成如今的样子,机率不超过猴子在打字机上乱打,打出莎士比亚全集。书上说,有个研究者提出,最早的有机分子,由少数粘合成“大分子”,一步步继续粘合,长成更“大”的生物,经过多少万年的进化,选择,粘合,才有了生命。不论这是否经过证实,至少在我听来是有道理的。www.coastidebbs.com
www.coastidebbs.com
说到底,这理论仍然是一种“生命递归” ,由种子开始,由少变多,由小变大,动态积累,不能跳步。生命其实是盲目的,不知道自己在整体中的位置,只能从现存状态做有限的挣扎,当然,不象计算机算法那样处于封闭状态,而是不时受扰动和灾难,可能犯错误,跃进,终止。这流向仍然是一般意义上的递归:发端是一种难以言说的天意或者“第一推动” ,而生命象默默跟着头羊走的羊群,不知所来,不知所终。
一再说递归,是强调它带来的生命无限性--纸带无限长,记忆无限多,可以运行无限的时间。而以递归为本的图灵机,却从一开始就既盲目,又“知道” 自己的局限---图灵用它证明第一个不可决定问题---图灵机会不会停。结论是,没有一个一般规律能够决定,对一些输入和算法,图灵停还是不停。停,这里是个预定条件,比如我可规定,移动的读写头走到某位置,整个机器停下来。条件因机器游戏规则而异,而最后我们知道的是,我们什么也不知道,无法一般性地预言,那个期待的地方能否抵达。因为一旦预言,结论必然矛盾,所以只好不预言。
证明就不说了。我其实懒得讲述知识,推导数学,只是喜欢聊聊引起我的审美兴趣的东西。www.coastidebbs.com
我们从图灵机这个模型看到,生命出发,不知道有没有终点,不知道前进的“意义” 。上帝预设了谜给我们,一代一代才有兴致递归式生存,不知所终。我们是快乐的亚当夏娃。www.coastidebbs.com
(这里我就把往回推跟往外推都当成递归了)www.coastidebbs.com
www.coastidebbs.com
***上面说到,图灵机的停止问题,不能一般性地预言,是否能停,但对个别图灵机,是可以的,比如规定到达1111000111就停,那么如果我有与之相应的语法函数,当然是可以停的。这正是另一个隐喻:生命可在某种程度上预言自我个体,但也许永远不能深入到他人,对人类没有通解。宗教总是期望提供通解,最佳解,然而至今仍在限定集合内有效。 www.coastidebbs.com
***数据分簇的隐喻www.coastidebbs.com
我们有一门课,Data Mining(数据挖掘), 内容之一是把数据分簇,最相似的放一起,说来很简单,照着图画画不就得拉?这其实是个繁重的任务,涉及很多算法。www.coastidebbs.com
1。 这个充满错误的世界www.coastidebbs.com
比如有种非常直观的,先随便选几个点,当成“簇”,然后被剩下的挨个比较距离,离哪个近归到哪,离哪个都不近就重分簇。有个专门的矩阵,计算“非相似性”。这个算法的好处是比较精确,坏处是太慢。后来有人优化之,从一开始不是选若干点当簇,剩下挨个试,而是剩下只试“优化点”,这样一来,只有被chosen的才进入最后的簇,速度一下子快了很多,但明显的代价是,优化点选错了怎么办?www.coastidebbs.com
有人说生活象下军棋,有天生的被选定的部分,有合理发展的部分。我看这个CLARAN算法也是一个人生或者世事寓言---既然生命有限,无法一一试来,我们只能选择小范围内的可能,然后的计算,比较,都是相对范围内的精确,其间不知错过几多“更优”。www.coastidebbs.com
2。边界www.coastidebbs.com
另种分法,是随便选点当“核点”,以它为核心画圆,预选规定,圆内必须有几个点,才能保持这个“核点”,不然,弃之。这是为保证最后分成簇的密度---最密的划到一簇里。而核点生出边界点,边界点挨个试验,自己是不是核点,是否能生出边界。一旦某点被定为核点,它就从算法中隐去了。因为我们关心的是最后的簇,是由边界点显现的。www.coastidebbs.com
说到底,人在各种研究中进行的各种分类,分析,比较异同等等,无非为发现边界。有人追索艺术与科学与宗教的同异,结果就是让我们反思几者的“核”,进而得到各体系的细节。这个模糊的分簇,最后如星云一样。而最后的边界点,是经过试验,不能长成核点的点。www.coastidebbs.com
所以,你我所以不同,是因为各自的边界到了极限--边界绝望地再也找不到自己的边界了,只好成了边界。www.coastidebbs.com
***乌托邦www.coastidebbs.com
现代人都晓得网络要紧,其实在科学研究中,一般的网络根本不够用。比如研究气象,就需要在亚洲欧洲的人共同观测,共享数据。我们的一门课,Grid Computing,就是讲这个,一个新出炉热烘烘bug兮兮的软件Globus,就提供这样一个Globus环境,大家好象同穿一件外套,各自有Globus账号,各自有权限。说起来是很fancy 的。随Grid Computing生出很多企业模式,TOP500强我们上课也讨论过。www.coastidebbs.com
这些新幌子,体现人的贪心,或者说,本身就来自原罪。没有贪婪和控制欲占有欲,连牛顿定律都不会有,当然也不会有贝多芬。人在自己划的圈里“非常罪,非常美”,自己高兴兮兮就完了。www.coastidebbs.com
上述问题不是问题,因为原罪不能拷问(又是一个坐标系内的公设),我只是感慨一下而已。博士教授忙不迭发论文,推着企业往前跑,同时弄出花招对计算机和网络模型敲骨吸髓,令人惊叹。而我上课却往往打不起精神,在数据乌托邦的美好图景面前毫不感动。而且,这一层一层的新平台竟让我倍感凄凉,只觉空中楼阁越垒越高,却让人想不出意思,因为这技术的七宝楼台,跟人的神经传动不直接搭界。可是,我自己在UNIX下写成了一个小烂程序,倒屁颠屁颠地乐。看来,为所谓创造而乐是一种很动物的感受,我们自私地乐自己的,对别人的乐园不痛不痒。www.coastidebbs.com
不过我们好歹有慈悲之心,就容忍眼前的一切吧:网络之上还有Grid,将来Grid上不只又有怎样的数据“黑帮”,既然有人为之欣喜若狂,我们也闭嘴收手不去黑了他们就是。www.coastidebbs.com
作者: 杜欣欣 时间: 2006-7-25 11:35
看尚兄评管风琴文章,我也转一个她的贴。
唉,阿达,简杨,寒江月...,不一一点来,这些女孩子真有才气,读书又多,羡慕不嫉妒,上帝怎么造出这些人,认识她们又是我多大的福气。
作者: 杜欣欣 时间: 2006-7-25 11:41
再转一个我的跟贴,只是写出来好玩儿,如有偏颇,先在此致歉。
“这个分法在我看来有些诗意:一沙一世界,一花一天国---沙与花在这里却是吃掉和包容世界的种子”----我觉得很有禅意。
慧元,还有一个关于icon的,也许你可以放入:
计算机屏幕上有许多icon,
印度教---你点哪个icon都可以到God那里去,你不会进地狱,不过是rebirth。
基督教---只能点画着基督头像的,否则就无法进天堂。
伊斯兰--只有一个icon~~~~,不点这个就进地狱。
作者: 尚能饭 时间: 2006-7-25 11:42
Originally posted by 杜欣欣 at 2006-7-25 04:35 PM:
看尚兄评管风琴文章,我也转一个她的贴。
唉,阿达,简杨,寒江月...,不一一点来,这些女孩子真有才气,读书又多,羡慕不嫉妒,认识这些人真是我的福气。
好一个“羡慕不嫉妒”!欣欣真是个大好人。
我曾经嫉妒过,现在也只有羡慕了--有些东西是学不来、求不来、争不来、抢不来的。“命中有时终须有,命中没有莫强求”。
作者: 杜欣欣 时间: 2006-7-25 11:46
Originally posted by
尚能饭 at 2006-7-25 04:42 PM:
好一个“羡慕不嫉妒”!欣欣真是个大好人。
---您这不是害我吗?有了这个头衔,以后还不更得谨言慎行,三省其身。
作者: fancao 时间: 2006-7-25 21:46
欣欣,
求你了,这上边到处是印记,花花搭搭的,看起来太难受,另外找一篇吧。最好把管妹妹请来自己贴,就没有转载之嫌了。
作者: 杜欣欣 时间: 2006-7-26 10:24
凡草,她大概自己不会来贴,回头,我找个不花的贴上。
作者: 兰若 时间: 2006-9-2 18:46
If everybody was gone, yidian would be in 碎片s~
作者: pugongying 时间: 2006-9-3 08:23
因为俺也是学计算机的。
真想不到现在的学生都不学汇编语言了。
看来他学递归学的很费劲。
欢迎光临 伊甸文苑 (http://yidian.org/) |
Powered by Discuz! 2.5 |