2010年9月11日星期六

How can GFW still be a problem?

Anyway, it might be a problem if you know nothing about internet technology.

Right here right now, I could visit blogger.com and edit the blog, however visiting *.blogspot.com is impossible.
With custom host file, visiting google, youtube, voa and bbc is fine, with IPV6 proxies, facebook and twitter works great.
What I need is just a newest host file including IPV6 address of the blocked websites, which could help me throw proxies away.

HTTPS and IPV6 could also be blocked in theory, however, the blockade will become the tombstone of all the dictators, sooner or later.

2009年2月9日星期一

CCAV 新楼失火, 论文小练习

"中央电视台新大楼北配楼发生火灾"相关报道,请各网站只用新华社通稿,不发图片、视频,不作深度报道;只放国内新闻区,关闭跟帖,自然滚动,论坛博客不置顶,不推荐.
以上引用

怀疑这条消息的真假, 于是开动GOOGLE 搜集证据. GOOGLE NEWS 中国版给出的相关消息近千条, 新华网上也有系列报道跟进, 看起来不像是封锁消息啊. 不过考虑到那则流言, 是不是通稿不重要, 重要的是管制到底存不存在 (这个似乎没什么讨论的必要吧...)

循证嘛, 实证研究要踏踏实实的做哦~

假设
H0: 引用流言"只用新华社通稿,不发图片、视频;只放国内新闻区,关闭跟帖"为假
H1: 引用留言"只用新华社通稿,不发图片、视频;只放国内新闻区,关闭跟帖"为真

样本选取
GOOGLE 搜索关键字"新闻", 第一页显示网站10个, 除百度新闻为新闻搜索平台外, 其余9家网站为: 新浪, 网易, 搜狐, 21CN, 腾讯, TOM, 39健康快讯, 央视网, 泡泡网. 因 39健康快讯 为健康类专门网站, 泡泡网为IT类专门网站, 故剔除. 另加入 雅虎, 新华 二网站, 共计9个.

检验项目
首页有无链接, 链接所在版块, 来源, 图片有无, 评论功能是否开发及评论总数/显示数. 如无评论总数, 则挑选评论较多的2个报道进行统计. 来源因不便逐个统计, 采取随机抽样方式 (点上谁就是谁...)

计算方法
显示评论数除以评论总数用以计算显示比率. 评论数为0的不予计算显示比率, 评论功能未开放或不具有评论功能的不予计算, 只有评论数未见评论总数的不予计算显示比率, 亦不予计算如总计数目.单网站总计数目为网站显示的相关评论总数或相关评论数目之和, 总计数目为各网站可计算评论数目(总数或抽样样本)之和.

结果
新浪新闻, 首页有链接, 国内新闻区, 来源新华网, 图片有, 评论部分显示
网易新闻, 首页有链接, 国内新闻区, 来源新华网, 图片有, 评论数为0
搜狐新闻, 首页有链接, 今日聚焦区, 来源新华网, 千龙网, 图片有, 评论部分显示
21CN, 首页有链接, 头条及娱乐区, 来源新华网, 中新网, 图片有, 随机抽取5篇报道, 评论总数为1
腾讯新闻, 首页有链接, 国内新闻区, 来源新华网, 央视网, 图片有, 评论部分显示
TOM新闻, 首页有链接, 新闻图吧, 体育娱乐, 影视快递, 来源
央视网新闻中心, 首页链接只有一标题"火因查证中", 但无法打开. 首席视频, 来源不明, 图片有(超小图片隐约可见火光中的央视新楼), 评论不详(根本打不开)
雅虎资讯, 首页有链接, 要闻区, 图片有, 无评论功能
新华网, 首页有链接, 新闻聚焦区, 来源新华网, 图片有, 评论未开放

留言显示数,总计数及显示比率见下表.


讨论
随机抽样调查, 总数不重要, 看看比率就好.
如表1, 评论显示比率分布于 8% 至 47% 之间, 总计显示比率约27%, 也就是说每四个评论中有大约三个不见了. 到哪去了呢? 有着这样疑问的我, 心中不禁升腾起这样一首歌: 春天在哪里啊春天在哪里~~~

本来想做留言和新闻稿的内容分析, 但介于我还没闲到那个份上, 就算了. 而且再往细里做, 比如建议网站间有无差异, 不同时段有无差异啥的, 检验了我也不会解释, 况且涉及到尺度等等问题, 也就省了. 新闻稿很明显大部分来源于新华网. 直观印象里, 在留下的四分之一评论中, 大致有这么几个主题:
* 救火英雄好样的!
* 唉, 但愿别烧到人啊
* 应该禁放烟花爆竹!
* 不能禁放! 这是传统文化!
* 少量其他类, 以及部分吵架贴

至于假设, 就这个情况来看, 显然是不能成立的. 除了央视网外, 所有抽样网站的首页都有链接并在报道中配图. 至少三分之一的网站打开了评论功能, 除雅虎没有评论功能外, 可以推断其他网站是把评论功能关闭了的. 三分之一的网站把这条消息放在了国内新闻区, 21CN直接大字头条摆在首页最上方. 当然, 它同时也把这条消息放在了娱乐区, 同样这么做的还有 TOM网, 什么心态嘛这是...

另据网友佐证, 网易上本来是有评论的, 但我看到的结果则都是0. 据未名BBS一帖子, 自称某论坛管理员的楼主声称接到了与流言相同的通知, 但其言真假就不得而知了.

研究建议
如果有和我一样蛋疼的无聊人士打算继续研究, 可以从以下方向进行考虑:
* 深度报道如何界定? 是否没有进行深度报道?
* 论坛与博客是否存在"不置顶, 不推荐"的情况?
* 相关内容的博客是否遭到删除?
* 被删的评论和博客的内容特征?
* 是否存在另一版本或第二版本的"指示", 导致各网站刊登配图通稿, 开放评论但加以过滤?
* 其他更蛋疼的方向, 比如被保留的评论有多少是五毛党发的...

参考文献
各新闻网站, 名字在上面了, 自己GOOGLE去

终于无视了references 格式一次, 爽啊...