-
数字是靠不住的
有人说,“世界上有三种谎言:谎话、弥天大谎与数字。” 你想过没有,人的标准体温真的是37摄氏度吗? 上个月的通货膨胀率真的只有5.8%吗? 房价真的会大幅下跌20%吗? 其实,数字不像你想的那么靠谱。 聪明人,别再被数字忽悠了! “使用手机会让罹患脑瘤的风险提高2倍”,“某公司员工的平均年薪为10万美金”,“上个月的通货膨胀率为5.8%”,“全球变暖冰山融化会使海平面上升20英尺” ……这样包含有数字的耸人听闻的新闻标题随处可见,如果你相信它们,那你就中了数字的圈套了! 在人们心中,数字天生就具备凌驾于个人主观意志之上的权威性,它一看就懂的特性,往往比长篇大论的文字更容易吸引我们的注意力。甚至无论某种说法多么不靠谱,只要它包含了貌似精确的数字,我们通常都会选择相信它。 跟其他炒作手段一样,数字可以被用来解除怀疑、蒙蔽记者、愚弄公众。于是,假专业人士、政客、企业、科研组织、学校、调研公司、新闻媒体之手,“数字的骗术”出现了,而且愈演愈烈。捏造的“原始”数据、伪造的统计结果和刻意歪曲事实的算法,以各种实实在在、令人担忧的方式影响着我们每个人的生活:不合格的新药上市,不合适的人选就任政府要职,不合理的新经济政策出台,被包装成低风险的投机产品,天价理发店,天价医疗费,等等。 数字的角色真假难辨,它既有说服力,又有欺骗性,到底我们要如何看穿数字?作者查尔斯•塞费引领我们拆穿波将金数字、成果包装、润色数字等唬人的数字伎俩,引用发生我们身边的新闻事件,教我们用普通人所具备的常识、生活经验与能力,去找出数字背后的真相,练就受用一生的数字透视力。 【媒体推荐】 读起来非常过瘾!它不仅仅是一本关于数字的书,更是一堂开阔视野的全民公开课! ——《纽约时报》书评版 作者向政府和媒体惯用的“数字伎俩”发起了猛烈的攻击。 ——《波士顿环球报》 书中形象生动的遣词造句、幽默风趣的写作风格,以及各种新奇的小花絮,引领读者拆穿波将金数字、成果包装、润色数字等唬人的数字伎俩,找出数字背后的真相,练就受用一生的数字透视力。 ——《费城问询报》 作者写了一本深有见地、观点独到的好书。 ——《达拉斯晨报》 一本让人变得更加清醒的著作。 ——《克科斯书评》 一本充满启迪意义的书,每个人都应该阅读这本书! ——《书目报》星级推荐 -
鲜活的数据
在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。Nath an Yau是这一创新领域的先锋。在本书中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)生成图表,以及在图形编辑软件(如Illustrator)中修改以使图表达到最佳效果。本书介绍了数十种方法(如柱形图、饼图、折线图和散点图等),以创造性的视觉方式生动讲述了有关数据的故事。 -
Mining the Social Web
Popular social networks such as Facebook, Twitter, and LinkedIn generate a tremendous amount of valuable social data. Who's talking to whom? What are they talking about? How often are they talking? Where are they located? This concise and practical book shows you how to answer these types of questions and more. Each chapter presents a soup-to-nuts approach that combines popular social web data, analysis techniques, and visualization to help you find the needles in the social haystack you've been looking for -- and some you didn't know were there. With Mining the Social Web, intermediate-to-advanced Python programmers will learn how to collect and analyze social data in way that lends itself to hacking as well as more industrial-strength analysis. The book is highly readable from cover to cover and tells a coherent story, but you can go straight to chapters of interest if you want to focus on a specific topic. Get a concise and straightforward synopsis of the social web landscape so you know which 20% of the space to spend 80% of your time on Use easily adaptable scripts hosted on GitHub to harvest data from popular social network APIs including Twitter, Facebook, and LinkedIn Learn how to slice and dice social web data with easy-to-use Python tools, and apply more advanced mining techniques such as TF-IDF, cosine similarity, collocation analysis, document summarization, and clique detection Build interactive visualizations with easily adaptable web technologies built upon HTML5 and JavaScript toolkits This book is still in progress, but you can get going on this technology through our Rough Cuts edition, which lets you read the manuscript as it's being written, either online or via PDF. via http://oreilly.com/catalog/9781449394844/ Amazon: http://www.amazon.com/Mining-Social-Web-Finding-Haystack/dp/1449388345/ -
内容分析法
内容简介 《内容分析法:媒介信息量化研究技巧(第2版)》主要内容简介:内容分析是媒介以及媒介经济研究中一种非常重要的方法,是一种对传播内容进行客观、系统和定量描述的研究方法,具有客观、方便、经济等优点。《内容分析法:媒介信息量化研究技巧(第2版)》是继1981年Krippendorf的经典专著《内容分析》之后又一本关于内容分析的书。该书提供了系统全面的内容分析研究的操作指南,深入分析了内容分析中的各种常见问题,如测量、抽样、信度、效度和数据分析中的各种技术,并附以大量案例,方便初学者学习和运用。《内容分析法:媒介信息量化研究技巧(第2版)》逻辑清晰,言简意赅,按照内容分析的步骤顺次介绍,操作性强,具有很强的实际应用价值。 《内容分析法:媒介信息量化研究技巧(第2版)》可以作为了解内容分析法的首选读物,是传播学、政治学和其他社会科学、行为科学研究中不可缺少的参考资料。 -
Dataclysm
-
纵贯数据分析
《纵贯数据分析》由四种讨论纵贯研究的小册子组成,分别是《世代分析》、《纵向研究》、《分析重复调查数据》以及《多元时间序列模型》。纵贯研究相较截面研究而言,其最大的优点是可以描述事物的发展过程和变化,并从这种变化中考察社会发展趋势。 《世代分析》介绍了检验数据时常用的一项分析方法,即世代研究。这本小册子分别讨论了世代研究的目的、定义、策略等问题,并结合实例,说明了该研究的具体应用和数据选择问题。《纵向研究》讨论了纵向研究的目的、数据收集、研究对象与研究模型等问题,能为研究发展趋势、历史变迁或动态过程的研究者提供帮助。《分析重复调查数据》指出,重复调查是从对个人层次的微观研究转向对整体层次的宏观研究,并讨论了重复调查的基本用途,即描述、分解、解释总体趋势、对个别参数变化进行估计。《多元时间序列模型》概述了多元时间序列分析中的许多高级方法,包括同时方程模型、向量自回归模型、格兰杰因果检验、冲击反应分析等。作者通过介绍这些方法,预测并描述了变量之间内生的动态关系。