2015年第一次诈尸

诈尸原因:把博客搬家了,一不小心进了后台,突然想干点什么事情。

What’s up:

把博客放到了 scaleway 提供的 ARMv7 架构的服务器上。说起来也算是个独立服务器。 性能只能算可以接受,但是我很喜欢这种 SoC 云的体验。scaleway 提供了完整的 API 接口,关于服务器的一切设置都可以通过 API 来操作。硬盘、IP、芯片分开收费,并且可以任意组合。3欧的价格也是可以接受的。

但是,毕竟 ARM 在服务器领域还是比较年轻,有一些东西没有官方的 ARMhf 支持我还真搞不定,比如 MongoDB 等。但是对于普通的 PHP-*+MySQL+Nginx(+Apache) 应用还是完全没问题的。 这台服务器放了几个 WordPress 博客,基本上没什么压力。毕竟是没有流量的站点。

说起流量,最近终于有站能每天 IP 过 10k 了。 对于本资深但是长期没流量的站长倒是一种挑战,有机会学习实践了一些服务器优化方面的东西,Flask+MongoDD 的坑也踩了不少,另外还用 Cython 实现了一些加速。至于分布式、均衡负载这些东西还真没到需要的程度。

我还是认为,一般情况下,对于以赚钱为目的的网站,服务器的性能问题都是盈利模式的问题。如果不是为了赚钱,那一切的投入都算是为了情怀、为了公会、为了部落、为了 「to make the world a better place」。 可是到了这个年龄没钱还谈梦想和情怀会真的觉得承重,每一个选择也变得更加艰难。

虽然如此,我还是选择坚持 coding,这是我从小的爱好。最近还是继续写写 Python,主要还是 WEB 方面,另外还有自己课程相关的有限元、结构稳定性分析和岩土工程方面的东西。研究生的课说实话很累的。

上周搞了一个超级简单的 Python 爬虫方面的库,算不上框架,但是可以让写爬虫变得更简单。地址:https://github.com/ericls/gspider 。

import 个 BaseSpider 和 几个 xxField 就可以了

class PythonDocSpider(BaseSpider):

    title = PQField('h1', format='text')
    content = PQField('p')
    functions = PQListField('dl.function', format='element')


b = PythonDocSpider(
    'https://docs.python.org/3/library/base64.html#module-base64'
)
print(b.title, b.content)

看看上面这个代码,基本上就应该清楚怎么用了。 当然 也可以自定义爬虫的 property 等, 可能我会写个 readme 给 repo。这东西我打算长期更新,毕竟自己经常用。

三个月前搞了一个图床好像也没在博客上面发过,借此机会发个地址:https://github.com/ericls/tushe

如果真的有人看这篇文章,那eRic在此祝你国庆快乐。

愿世界和平。

October 5, 2015