埃默里图书馆的数字学术共享(DiSC)收集了超过1000万条关于占领华尔街运动的推文,并将它们塑造成可视化,比如词云和热点图.光盘学者和工作人员揭开了微博# OWS项目该活动始于2011年10月,当时正值街头示威一周年。
“Twitter不允许用户回去下载大量的推文;它会存档,但不允许免费的、公开的访问。”DiSC协调员斯图尔特·瓦纳解释道。“一条推文的公共生活是有限的;过了一段时间就不可能再找回来了。”
他说,有一个集合的唯一方法是做什么是emory图书馆的软件工程管理器斯科特叔叔做了一块软件,并编写了一个“侦听”到Twitter并复制了适合特定描述的所有物件。“我创建了一个名为的开源应用程序'twap'这是推特陷阱的缩写。”它可以被任何人使用,并通过特定的标签捕捉推文,”特恩布尔说。
瓦纳说,这个项目的灵感来自一个网上的沉思,“想知道是否有人在保存占领华尔街的这些推文”。他指出,社交媒体在“占领华尔街”(Occupy Wall Street)运动中发挥的作用也影响了这一运动。“占领华尔街”运动“激发了很多人的想象力”。
目的是为社交媒体使用大量的数据集,帮助用户找到事情发生的地点和原因——“为学者创造最有用的集合,”Varner说。
档案的可视化是由Moya Bailey,Sarita Alami和Katie Rawson创建的,这是光盘的三位毕业生。艾拉姆说,处理1000万推文是“非常大规模的承诺”。
“占领华尔街”运动的画像
“阅读这些推文是对占领华尔街运动周围和内部社交媒体活动的迷人快照,”阿拉米说,“通过数字方式收集它们,让我们知道哪些主题和想法最经常出现。”她发了一个博客条目创建热图。
阿拉米解释说:“我通过绘制每条推文的纬度、经度和日期绘制了纽约市的动态热图,可以为占领运动绘制出一幅迷人的肖像。”“对我来说,那种(在纽约祖科蒂公园)在警察迫使抗议者离开之前不会减弱的活跃活动中心的景象是非常强大的。”
她指出,2011年11月警察强行清理祖科蒂公园后,布鲁克林大桥上的推特活动激增。“在很多方面,桥上的这些人都是这场运动的中心人物,他们在推特,世界各地的人都在转发这些信息,所以总体上占领运动的推文数量大幅上升。”
看看这场运动一周年纪念的推文,瓦纳表示,对话仍在继续,尽管不像去年那么多。他表示:“它有下降的趋势,但我们在想,一周年纪念是否会出现小幅上升。”
法律、道德、隐私和版权方面的考虑限制了收集到的推文的传播。瓦纳指出:“你不能真的转发这些推文,但你可以把它们当作数据。”美国国会图书馆正在归档所有的推特信息,但目前公众无法访问这些信息。
他说,正在讨论的是一场黑客马拉松——邀请人们对数据进行研究,看看他们会发现什么并利用这些数据做些什么。正如DiSC解决方案分析师Jay Varner解释的那样,艾莫利大学项目的未来将取决于占领华尔街运动本身所发生的事情。他说:“我们想宣传我们拥有这些数据的事实。”Bailey补充道:“我们鼓励人们来DiSC使用这些功能。”
莱斯利·金(Leslie King)于2012年9月21日发表的埃默里报告如下:http://news.emory.edu/stories/2012/09/er_occupy_wall_street_tweets_archive/campus.html
(访问2012年12月83日)