【数盟致力于成为最卓越的数据科学社区,聚焦于大数据、分析挖掘、数据可视化领域,业务范围:线下活动、在线课程、猎头服务、项目对接】
谈到数据新闻,总也绕不开技术。记者不懂点行话qgis二次开发,还怎么跟团队技术小伙伴沟通?
两位主讲嘉宾
在NICAR会议上,数据极客同时也为NBC4调查记者的Tisha 一起和ProPublica新闻应用开发师Sisi,向大家介绍了一些熟悉又陌生的技术,分享了不少软件、互联网平台等。
赶快熟悉下,创作出更精彩的数据新闻作品吧!
基本术语CMS
Content management system(内容管理系统),可以通过CMS实现内容管理及发布,CMS通常基于模块式的开发,每个新闻编辑室都会有内容管理系统,最为典型的CMS就是博客系统”wordpress“。
Modeling
Statisticalormathematicalmodeling(数据建模),建模通常是由科学家或者研究者完成,能帮助我们理解系统如何运作。
AWS
Amazonwebservices(亚马逊网路服务系统)qgis二次开发,你可以向其付费来运营你的网站。
OpSec
Operational Security(运营安全),作为记者,如何保护自己的新闻源?在斯诺登事件之后,这个问题变得更为重要。
编程相关
编程实际上就是与电脑的沟通对话,以下这些就是我们跟电脑沟通时所用到的语言。
Ruby和Python
这是两款常用的编程语言,Ruby和Python在手,天下我有。比如,在做非法枪支买卖的专题时,你可以用Ruby扒取网站上的枪支广告。
Node.js
Node.js是可用于服务器端的javascript运行环境,通常适用于高并发的应用场景。
Django,Rails
这两个叫做“框架结构”,运用Django和Rails构建框架,这样你就可以在互联网里创建出成百上千的网页了。Rails基于Ruby,Django则基于Python。
API
ApplicationProgrammingInterface(应用编程接口),计算机读取网页的“捷径”。不少公司(比如Twitter)都开放了API,别的程序员就可以运用这些公司的数据来创造一些有趣的项目。
Grunt
一个提供预览和测试html/css/js的软件,确保代码的可以正常运行。(笔者认为这个程序很有利于写出干净有序的代码,大家不妨一试。)
网站/服务/产品CodePen,JSFiddle
在线编辑html/css/js语句和分享的网站。
StackOverflow
你可以在这个网站上提问,尤其是关于编程的问题。
Tabula
从pdf中提取数据的免费软件。
数据类型电脑储存数据会有多种格式,以下三种是可以互相转换的。
CSV
逗号分隔值文件格式,其文件以纯文本形式存储表格数据(数字和文本)。
XML
用这些来分隔数据,是一种用于标记电子文件使其具有结构性的标记语言。
JSON
一种轻量级的数据交换格式,JSON语法是JavaScript对象表示语法的子集。
地图绘制
ESRI
美国环境系统研究所公司,开发了ArcGIS工具。
QGIS
开源免费地图软件。免费,但是没有ArcGIS好用。
Tilemill
制作地图的软件。
Mapbox
Tilemill的所属公司。
FusionTables
一项Google服务,你可以上传数据,并运用Googlemaps来制作地图。
CartoDB
一个制作并在线发布地图的网站。页面精良,有付费和免费版本。
ShapeFile
运用点、线、多边形来描述形状的描述的文件。我们可以运用这些文件来制作地图或者地图上的图形。包含有郡县的边缘或者是湖泊的界线。
数据分析
SQL
结构化查询语言,用于存取数据以及查询、更新和管理关系数据库系统。
MySQL
一个十分热门的数据库管理系统。
SQLite
生产嵌入式SQL数据库的软件,可以不通过服务器来建立数据库。
PostgreSQL
更为高阶的SQL数据库管理系统。.
pgAdmin
PostgreSQL的管理界面。
RegularExpressions
正则表达式,通常被用来检索、替换那些符合某个模式的文本。
OpenRefine
一个免费且强大清理数据的软件。
DocumentCloud
由记者创建的,一个可以上传、搜索pdf并可以对pdf进行注释的网站。
GoogleAnalytics
Google创建的网页流量分析软件。
统计Regression
回归,统计术语。测试变量间相互依赖的定量关系的一种统计分析方法。
SPSS
付费的统计分析软件。
一年前江湖上还没有R的传说,现在人们都在用了。这是一个基于统计计算和绘图的的编程语言。
RStudio
一款好用的R语言编辑器。
dplyr
最近两个月刚发布,更快更简易地操作、探索数据的R语言软件包。
SensorJournalism传感器
SensorJournalism
专业记者和自媒体运营者通过传感器收集和利用海量信息与数据来“讲故事”的新闻生产模式。
Arduino,RaspberryPi
两种类似的硬件,运用其附带的软件进行编程,改造成传感器。
本文由“镝次元数据传媒实验室”授权转载,在此向原作者致谢!
娜娜项目网每日更新创业和副业教程
网址:nanaxm.cn 点击前往娜娜项目网
站 长 微 信: nanadh666