CsQuery——比HtmlAgilityPack更好用的网页解析库

作者:V君 发布于:2016-1-31 5:58 Sunday 分类:折腾手记

之前写爬虫总是用HtmlAgilityPack来解析HTML, 当坐骑来用.

直到室友L同学推荐用这货之后, 发现自己还在用那么落伍的东西, 整个人都不好了, 果断换坐骑.

这货不仅能解析HTML, 还能操作内容之后再吐出来, 模板引擎啊这是! (貌似还可以嵌入到MVC...

尽管HtmlAgilityPack也能操作内容,并且再吐出来. 但是两者用法差别到上天下地.


废话不多说直接上代码比较!

阅读全文>>

标签: 软件开发 C# 模板引擎 MVC 爬虫 HTML

评论(2) 引用(0) 浏览(2874)

使用SOCKET需谨慎,莫让TCP Keep-Alive把你流量耗光

作者:V君 发布于:2016-1-25 18:13 Monday 分类:挖坑经验

点击查看原图

今天收到报告

说终端设备跑流量超标很厉害

因为不是咱的代码(将来就是了吧)

问了些情况 --

    应用层面日志很正常

    原始数据也不多

    (虽然仅记录从设备发来的)

怀疑是不是服务器抽风

一个劲的下发数据

于是直接上去抓包了

抓了一个小时, 打包传回


 \\我一看// (葛炮音


哎哟我的玛雅 按这个间隔

一个月能跑掉30M流量


对SOCKET/TCP/IP了解不多 不知道这是不是正常现象 不过从流量上来看绝对不正常


咕狗 && 问万能的麻衣阿姨    再回来看代码       

点击查看原图

嗯嗯 这下啪啪打脸, 走GSM无线的你拿来拔网线 (´∀((☆ミつ

点击查看原图

这下应该好了吧 (竖起拇指+牙齿闪光 

 

次日更:

不要觉得这样就大丈夫了, 还有问题 -- 连接数用完

又抓了一个小时, 发现大概每隔50秒会重新连接

点击查看原图

看来还是要开Keep-Alive, 设置到40秒吧, 每个月需要消耗2~3M流量

点击查看原图

继续观察...最后决定设置为45秒, 之后终于不浪费流量了.

标签: 软件开发 C# SOCKET TCP 抓包

评论(0) 引用(0) 浏览(1773)

升级SSD啦!重装系统并让旧的在虚拟机上运行

作者:V君 发布于:2016-1-17 2:51 Sunday 分类:折腾手记

系统毛病随着使用时间增加,直到放弃治疗。

但是对重装系统不服,只好用换SSD方式推进自己了。

老的系统和之前一样,放在虚拟机里面,对比着慢慢地把新系统调整到之前的使用习惯。

 

经常装系统老鸟飞过即可,咱只是抒发一下不经常重装系统的感受。

阅读全文>>

标签: Windows7 SSD 系统安装 虚拟机 虚拟光驱

评论(0) 引用(0) 浏览(1746)

PSV港版:误注册国服换回港服

作者:V君 发布于:2016-1-6 0:25 Wednesday 分类:折腾手记

TL;DR: 设定->格式化->初始化本机 重启后按提示登录或注册

 

入手时啥也没注了解, 注册了国服的PSN账号

原来国服Store没有重力眩晕DLC (至少现在没有!)

阅读全文>>

标签: PSV PSN PSN换服 DLC

评论(2) 引用(0) 浏览(2411)

自己动手写一个SOCKS5/SOCKS4/HTTP袋(t)里(i)服(z)务(i)器

作者:V君 发布于:2016-1-2 1:50 Saturday 分类:折腾手记

源代码在SVN.(关闭了

支持客户端协议: SOCKS5 SOCKS4 HTTP

服务端环境要求: mono 如果有反向代理要支持websocket


---- 最快使用方法(TL;DR) ----


1)下载最新版本体 (频繁更新,不稳定,爱用不用,你可以下源码来编译)

2)丢到服务器用参数 S <密码> 启动服务

3)在客户端使用 C <HOST>:<PORT> <密码> 启动客户端


目前的版本写死了服务端/客户端监听8080

客户端允许指定服务端端口是为了应对有反向代理的环境,可指定80或443


---- TL;DR完毕,补充介绍 ----

阅读全文>>

标签: 软件开发 C# mono HTTP SOCKS

评论(0) 引用(0) 浏览(4007)

Powered by emlog 去你妹的备案 sitemap