近日在网络上看见了一个网名叫“独来读网”,这名字真好,由衷的觉得很喜欢。我也是很喜爱在网上阅读的人,很喜欢在觉得孤独的时候上网来阅读,看技术文章,看网络小说,也看社区里那些调侃的文字,然后在电脑前独自微笑或者轻轻叹息。因为有了这种阅读,我可以长时间一言不发,沉默着打发掉孤寂的时光。 在网上阅读的时间久了,就会有一些感触。
归档 九月 2010
ram host vps 试用报告
相对于我的linode来说,ram host VPS 是相当便宜的了,2.99$一个月80M内存。各位开博的朋友们见笑了。 选择ram host的动机: 笔者平时为一些小企业做展示型的网站,业务本来就不多,大部分都是朋友介绍的,制作费用也不高。结果由于bei an 问题,现在所有网站竟然都要补办。我的那个头晕啊,遂一个一个跑bei an。哎,那个麻烦别提了。最重要的是大部分企业老板都不愿意再出钱让我到异地bei an 拍照了。算了一下,如果都去拍照,损失巨大,无奈之中只好转战国外便宜的vps,ram host是选择之一。
秋意短、情意长、寻一步地老天荒。
这个城市的秋总是特别的短,总是来不及感知落华纷飞,红叶蔓延一片的美好,来不及觉尝那满满一捧玫瑰的芬芳和十里飘桂的清香,来不及沉醉攀满的蔓藤和泥土的灿黄。还来不及落幕炎热的夏,便迎来了冬的冗长。 可是谁能说秋没有来过。当天不再被蒙上厚厚的尘埃,白色纠结的云朵一片片散开,露出无比纯美的蔚蓝,像极了退潮而平静的海。秋便是这一时光里最真实的存在。 你听,在秋到来的这一天,她的幸福渲染成花。她再不是个爱哭的娃娃,甩掉鞋子奔跑进喷泉,那笑是清亮。她逃离了整片的阴霾,那些未知的黑暗再不会排山倒海。欣喜早已乘不住满满的心房,在秋日中沉眠,也能落一身美好一片希望。她紧握着十年寒窗苦,大大的坚强击败小小的脆弱,坚定的走在路上。 你听,在秋到来的这一天,她的泪晶莹透亮。她再不用默念爱人的名字,抱着无尽的思念去逃亡。未来的路那么远那么长,她怎么舍得将他从此遗忘,丢他一人尝尽伤悲,独自流浪。她怎么舍得彼此照耀的承诺还来不及慢慢实现,便已成荒原。舍不得丢掉的水晶鞋,还在那约好的出口等他来赴约。眼泪滴落下来,好似要流尽全部的绝望,也流尽那消失的癌细胞。 你听,在秋到来的这一天,她感知了宝贝伸腰翻身的力量。她摈弃了歇斯底里和固执的清冷,舒坦了内心柔软了平静。她想再诚恳一点再珍惜一点,那么是不是所有的归途都落满美好。她没有这么安宁的过过,只要他一动,便觉得是快乐。这一段沉重的旅途,如今才知爱和亲情的重量。她珍惜做母亲这样的赋予,血缘这条线密密麻麻的缠绕着,饱满了岁月,勇敢了感觉。 是谁说,秋是收获的季节。你听,那分明是希望发芽的声音,是幸福堆叠的声音,是微笑扬起,水光潋滟的声音,虽然短暂,虽然颠簸流离,但站在阳光下都遮挡不住透过指缝的温暖。将他们一点一点存放在心房,便有了翻山越岭,穿越寒冬,去寻那地老天荒的勇敢和力量。
读一点历史吧
历史的博大在于它几乎是这个地球上所有生存过的人共同写就的,你相信你的智慧,你就更要相信历史透出的智慧。 读史使人深刻。这是一个哲人说的。开始真的不是很理解,总觉得现实中的大千世界已经足够的丰富多彩,令人目不暇接,再说流行的节奏是如此的快,有那么的钱需要想着去挣,研究都研究不过来。读史好像有点顾不过来。再说那些故纸堆里的东西似乎只有霉味,那里有现实中的鲜活气息。 但是现实中的事情有时往往不争气,有时一些原来十分撩拨人心得东西最后经常弄的人十分没劲,于是偶尔读史,竟然发现往往历史早已经将现世中的许多事情重复了许多遍。于是窃笑,为什么历史已经重播了无数次的荒唐,就像马戏团换一个地方、换一个时间就可以重新博得掌声。看来还是我是太不重视读史了。象是在一块不大的林子里打转,还当是在不断地在披荆斩棘。 不读史,一不小心就容易为现实中一些古老的而翻新的荒唐叫好。其实道理很简单。我们每一个人的生命相对绵长的历史都是很短暂的,我们每一个人的见识,相对无数人几千年曾经的沧桑总是浅显的。我们往往无法用一生去追踪一个“因”会最终会引出什么“果”,也无法知道今天我们看到的果,是历史上那一个问题的“因”。 我们经常会激烈的争论,认为一些问题永远不会有标准答案。其实并不是这样,时间会给一切问题以答案。以历史的深厚,总是可以让我们将一些看似没有答案的问题看清楚,让我们将今天的路走好,至少不出现大方向的错误。读历史其实就是这样,让人们在纷繁复杂的世事面前保持清醒。 现在读史正在流行,与其说是易中天一度炒热了读史,不如说是饱经现实浮躁的人们,被被物欲裹挟得心力交瘁的人们,正在更加成熟和睿智地看待世事。读史会有一种超然,会有一种俯视的感觉。这其实不难理解,一时一事的的得失,如果迎头相碰,往往会令人急火攻心,但是我们若是能够俯瞰这种得失,我们就会超脱许多,了解历史有时就是可以给我们这种高度。 读史容易引起超脱,有人对超脱是有所不肖的,认为超脱是一种无为,无为是一种泻药,容易泄掉人的斗志,其实无为也好超脱也罢,只要不是懒人的借口,只会泄掉人们急功近利的虚火。少一点过激,多一点敦实和自信,少走一点弯路。 历史实际上就是一部人的活动史,读史就会遭遇一幕幕人类悲剧和苦难,这种当口,每每会有很多人会有拯救的妄想,这其实是在激发你悲天悯人的心肠。说不定,你的悲悯可能真的会让现实中苦难的人感到好受一些。 历史不要再发霉了,我们知道书写历史是要有良心的,需要秉笔直书的勇气,解读历史的人同样要有良心,不能以自己的喜好去装扮或者肢解历史,需要的是细心拂去历史的尘埃,还历史于本真的勇气。扭曲或者子虚乌有的“史实”会让读史成为和观看插科打诨的“戏说”差不多的娱乐行为,和清醒与反思就根本不在一条道上了。最近听说高陵的真伪在被人质疑,这其实是一件好事,社会的理智就是在质疑中提高的,也好让那些急着拿历史卖钱的人去反思一下。
网站发布机开发进度
笔者自己写的文章“原创”+发布软件开发已经有一段时间了,在解决无数问题之后,终于到了最后阶段--软件测试。 生成的结果也相当不错,例如有这样一个网页,我随机从库里找的一篇新闻 原文地址: http://news.cnxianzai.com/2010/09/292153.html 正文抽取结果:男童打疫苗后死亡 广西查获千余份假狂犬疫苗正文抽取结果 ===================单文本摘要后的文本====================================== 据南国早报报道2009年10月底,广西来宾市兴宾区正龙乡果塘村一名5岁男童被狗咬伤后,到该乡卫生院打狂犬疫苗,21天后病发致死。经化验,所用狂犬疫苗为假药。来宾市经几个月调查发现,全市非法渠道进购药品的乡镇卫生院13家,村卫生所(个体诊所)20家,查获“问题”人用狂犬疫苗1000多人份……。男童病死查出疫苗造假。送检的疫苗经过检验,为假药。卫生院长被拘留38天。叶显幹的儿子小建在正龙卫生院出事后,来宾市有关部门还在该卫生院药房里查获了一批假疫苗。肖建昌告诉记者,2009年10月,正龙卫生院防疫组新进了同一个批号的狂犬疫苗,只有20人份,是来宾市信尔医药有限公司提供的。狂犬疫苗属于二类疫苗,有资质的单位都能够进货。13家卫生院查出假疫苗。经查,来宾市涉嫌从非法渠道购进药品的乡镇卫生院13家,村卫生所(个体诊所)20家,涉嫌非法销售疫苗12人。涉案“问题”人用狂犬病疫苗1000多人份,涉及货值33万多元。 ======================================================================== 下一步是生成多文档摘要,将多篇文章的精华,按照时间、地点顺序浓缩成一篇全新的文章!达到原创的目的。离胜利只差一步了^_^~~~~
关于文本去重及数据清理的一些想法
前几天一直研究如何从网页中抽取正文,使用的方法是基于文本相对于html标签密度。虽然只用到了最简单的统计学原理,但效果好的让我惊讶。 随之而来的问题是,统计学无法剔除一些与正文无关的或长或短的文本。重复短文本在采集论坛型网页中尤为突出;例如用户签名、在线时间等。另一些无法剔除的长文本如网页底部的版权信息、声明也占据很大比例 显然,这些文字有一定的相似性,并且无法通过简单统计来确定去留。 想过用神经网络加监督学习的方式来去噪,但似乎并不成熟,且需要大量训练文档语料库,太费事。 偶然想起以前从谷歌黑板报上看到关于计算文本相似度的文章,觉得大可以借鉴一下。 步骤设想如下:分词、去除停用词、计算tf/idf权重并为每行生成一权重项量、初步过滤、计算相似度去重、文本聚类、数据清理、结束。 目前,前三步的编程工作己完成。难点在后面。 ^_^,感觉越来越难,不过也很有成就感,毕竟是自己的作品嘛
平凡的幸福
中秋之夜,我们这里由于“凡比亚”的原因,下起了秋雨,赏月是没门了,宝妈抱着宝宝坐在身边看电视;我舒服地在电脑前码着字,平凡中的幸福,让我感触颇多。 自从结完婚,越来越感觉生活归于平淡。有时也有点点担忧,难道这真的和书上说的一样,“婚姻是爱情的坟墓”么?好在,宝宝的降临,让全家人忙的一刻不停,她就是全家人的开心果;才八个多月的小人儿,现在已经知道黏着爸爸妈妈了;开心的时候会找你;伤心的时候会找你;饿了的时候也会找你。张开小小的臂膀,要你抱她、呵护她。也许这就是平凡中的幸福吧~
一个男人,一生要爱多少女人
一个男人,一生要爱多少女人?我问了很多的人,男人们的回答真是众生相。
正文抽取中阈值计算公式
下文是网站发布器的正文抽取所用到的原理,描述起来有些费劲,用公式写出来,做个备忘。 如何确定正文抽取中阈值的大小,用 小写 y 表示文本项,小写 z 表示非文本项,最佳阈值可以描述为一个文本项概率(p)与每项之前分布的关系。
推荐几个linux系统下载镜像
以前收集了不少linux系统的ISO镜像下载网站,速度都很不错,需要的朋友可以看一下 http://mirrors.163.com/ 网易的开源镜像站,主要针对电信的;我这里下载是最快的,在公司下载速度最高可以达到5MB/S ^_^ http://centos.ustc.edu.cn/centos/ 中国科技大学的centos镜像网站,速度也是超快;不过貌似只提供centos镜像,其他的没发现地址 http://ftp.twaren.net/ 台湾高品质学术研究网络,台湾的站点速度也还可以;提供的镜像也比较全面,出了提供linux,BSD系统的也有的下载 http://ftp.tcc.edu.tw/ 台中县教育网络中心,提供FreeBSD、centos等相对较流行的linux、unix镜像下载 剩下的还有好多走海底电缆的linux镜像就不提了,速度鸡肋了点,高速的就介绍这么多吧,总有一个适合你^_^


