归档 十月 2010

玩转小内存 ramhost VPS

在之前的博文中笔者记述了购买的小内存ramhost VPS遭受黑客攻击以及修复的过程 ramhost VPS 除虫记 。经历了这次黑客事件后,笔者不再使用ramhost自带的kloxo控制面板的OS,改用nginx+mysql+php-fpm的方式自己构建web服务器。 然而对于只有80MB内存的小VPS,该如何配置呢?

VPS 编译 安装OpenSSH通用指南

前段时间,笔者在ramhost上购置的小型VPS惨遭黑客攻击,虽然数据没有被破坏,但黑客的攻击行为让客户网站受到了一定的影响一直无法正常运行,让笔者倍感头痛。笔者做了一点分析,VPS的ssh登录安全认证没有做好,是导致黑客的破坏行为得逞的主因。 今天把VPS重装了一遍,首要任务就是加强ssh的安全性。下面记录笔者下载、编译、安装、配置OpenSSH的全过程,以飨读者。

ramhost VPS 除虫记

笔者前段时间在ramhost VPS上购买了一款小型VPS,用于存放一些托管的企业网站,流量不大,用着也很舒服。今天做例行的网站数据备份,发现VPS上挂的两个网站都无法访问,被重定向到http://www.microsoft.com/en/us/default.aspx 这个网站。在确认了不是本机DNS劫持以及GFW没有拦截以后,笔者随即登录VPS的root查明原因。

近期工作总结基于贝叶斯分类的文本过滤软件开发

最近一段时间忙于开发文本过滤软件,疏于打理博客了。经过近一周的工作,基于贝叶斯分类的文本过滤软件完成了从理论到实际开发的过程,已经初具雏形了。 笔者从网上搜集了约1200行文本记录,其中约900行正常文本,300行需要过滤的垃圾文本,并对这些文本进行了训练,实验的结果是相当不错了,可以过滤掉大多数长文本如:版权声明、广告、论坛签名、文章发表时间等等。具体请看第二张图的实验结果^_^

国内的云端存储 金山快盘

在介绍金山快盘之前,不得不提一提笔者的使用初衷,源于一个字--“背”!=_=! 笔者绝对算的上是个懒人,懒得去使用高云端存储之类高新技术,以至于每次写玩一大堆代码,下班后再背着笔记本回家接着写….(在家懒的开台机)

PHP html解析器代码

虽然笔者更主张使用高级语言做html的解析器;可今天笔者让我们web界的小强php也做一把html解析器,证明小强的功力是多么深厚^_^ 算法思想的说明: 可以将整个算法理解为一个有限状态机,首先获取 “<”,然后解析小于号右边的字符串直到 “>” 为止。这样,便完成了一个html标签的解析过程。

贝叶斯分类算法在文本过滤中的应用

贝叶斯公式的应用可谓相当广泛,在机器学习中,最常用来作为分类器使用。同时,在垃圾邮件过滤方面贝叶斯分类器也有十分不错的表现^_^。好奇的同学,可以找找自己的foxmail中,也有贝叶斯分类器的选项。 之前,笔者曾经谈到过正在开发的一款软件 网站发布机 其中需要将采集后抽取到正文的进行过滤处理,滤除与文章无关的,例如:页脚版权声明,连续的英文字符串等等。尝试了很多方法,均告失败=_=! ,直到看到一篇使用贝叶斯公式过滤垃圾邮件的论文,思路才明晰起来。能否利用同样的原理来对文本进行过滤呢?笔者也对方案的可行性做了一些分析。

Linode VPS设置VPN的shell脚本

Linode VPS默认支持建设VPN(虚拟专用网络),一直觉得没什么用,也就没有理会。昨天看到godaddy送了75$的google广告费,遂生出架设VPN的念头。笔者的服务器是centos5.4的操作系统,VPN的设置相当简单;如果你也想架设VPN服务器,那么一起跟着做吧^_^. 从概念说起 什么?!不知道VPN干什么用的?!VPN可是个好东东呢,如果您还在用代理上国外“某些特别的网站”=_=!,那么立刻甩掉代理,用VPN吧,因为它更安全、高速。 VPN的英文全称是“Virtual Private Network”,翻译过来就是“虚拟专用网络”。VPN可以通过特殊的加密的通讯协议在连接在Internet上的位于不同地方的两个或多个企业内部网之间建立一条专有的通讯线路,就好比是架设了一条专线一样,但是它并不需要真正的去铺设光缆之类的物理线路。

新浪云计算平台更新到Beta版本

之前利用新浪云计算(SAE)平台开发的thinkphp4sae  项目自动完成了基本开发后就没有再动过了,主要是觉得新浪云计算的文件存储方式不是很方便(需要调用sae自己的文件存储类),对图片处理的支持也很有限,遂放弃了继续开发。如今新浪云计算平台更新到Beta版,且看SAE新版本有何改进之处。

基点俱乐部邀请码更新

^_^,有效期10月7号到17号,需要的朋友抓紧了

    第 1 页,共 2 页12