Báo chí dữ liệu/data journalism

Báo chí dữ liệu là một đặc sản của báo chí, nó phản ánh vai trò ngày càng tăng của các dữ liệu số được sử dụng trong việc sản xuất và phân phối thông tin trong thời đại kỹ thuật số. Nó cũng phản ánh sự tương tác ngày càng tăng giữa các nhà sản xuất nội dung (nhà báo ) và một số lĩnh vực khác như thiết kế, khoa học máy tính và số liệu thống kê.

Ở Việt Nam, báo chí dữ liệu cũng đã được nhiều toà báo quan tâm và ứng dụng mạnh trong hoạt động sản xuất tin tức của mình, như VNE hay Vietnam Plus…

Xin giới thiệu bài viết của Simon Roger, Biên tập viên của The Guardian, công bố ngày 25 tháng năm 2014.

  Guardian Logo

Báo chí dữ liệu là gì ?

Sau khi hỏi  một trăm nhà báo, bạn sẽ nhận được hàng trăm câu trả lời khác nhau.

1) Báo chí dữ liệu thực chất là  việc sử dụng con số để kể lại câu chuyện tốt nhất có thể. Nó không phải là toán học, hoặc biểu đồ hoặc thậm chí mã.

2) Bạn không chỉ suy nghĩ nhiều về từ ngữ. Thay vào đó, đây là cách tốt nhất có thể để kể câu chuyện.

3) Các kỹ thuật của  báo chí dữ liệu thay đổi, nó được đưa ra bởi các công cụ phong phú và ngày càng dễ tiếp cận hơn

Hãy tưởng tượng bạn đang làm việc như một biên tập viên trong những năm 1980. Những công cụ mà bạn sử dụng trong công việc là gì ?  Chắc chắn đó là một quyển số ghi chép và 1 cây bút với khả năng tốc ký. Một máy ghi băng cassette để sao lưu.

Và sản phẩm ? Nó được in trên giấy.

Vì vậy, nếu bạn đang phải đối mặt với những con số hay thống kê, bạn sẽ làm gì ? Các công cụ của thống kê không phải là công cụ của một phóng viên. Bạn sẽ dựa vào việc phân tích, nghiên cứu và kết quả của người khác.

Nhưng bằng cách nào đó, dữ liệu luôn luôn là một phần của cách tổ chức hoạt động xuất bản tin tức. Báo cáo tài chính đã luôn luôn được dựa trên sự hiểu biết về các con số. Tờ Wall Street Journal (Thời báo phố Wall) đầu tiên đã xuất bản một sản phẩm hàng ngày “Dow Jones customer’ s afternoon letter” xuất bản vào năm 1883 dựa trên bản tin ngắn gọn được bán tận tay suốt cả ngày cho những nhà đầu tư trên thị trường chứng khoán. Những “flimsies” (bài viết trên giấy mỏng của phóng viên) được tổng hợp lại trong một bản tóm tắt in hàng ngày được gọi là “Customer’s Afternoon Letter.” Và từ đó nó đã trở thành tờ Wall Street Journal.

Những bài viết về thể thao cũng dựa trên dữ liệu trong hơn 100 năm – vì vậy những bài viết về bóng chày cũng sử dụng những con số liên quan đến môn thể thao này.

Đối với những lo lắng về các nguồn dữ liệu, lấy ví dụ của John Snow. Ông là một bác sĩ ở Victoria chứ không phải là một phóng viên, nhưng tác phẩm của ông về bệnh tả và cách ông kể một câu chuyện mà ai cũng có thể hiểu đã làm thay đổi thế giới.

Trong thế giới của những năm 1850, dịch tả được cho là lây lan bằng hơi độc trong không khí, vi khuẩn chưa được hiểu rõ, sự bùng phát đột ngột và nghiêm trọng của bệnh tả ở Soho, London là một bí ẩn.

Snow đã sử dụng các số liệu: ông vẽ bản đồ mô tả vị trí các trường hợp bị bệnh. Bản đồ của Snow đã có một tác động mạnh mẽ bởi vì nó chỉ đơn giản là một cách trình bày dữ liệu rất dễ hiểu.

Snow không phải thành viên trong nhóm các nhà phát triển tính tương tác của truyền thông. Ông là một bác sĩ. Ông sử dụng một bản đồ và nó là một phần trong nghiên cứu thống kê chi tiết của ông. Quan trọng hơn, nó đã thay đổi cách chúng ta nhìn dữ liệu trực quan và giúp chúng ta thấy vi khuẩn một cách tốt hơn.

Data_driven_journalism_process

Đó có phải là báo chí ?

Trở lại năm 2009 một trong những người sáng lập của báo chí dữ liệu, Adrian Holovaty[1] đặt câu hỏi này: Đó có phải là báo chí dữ liệu? Có phải báo chí tạo ra cơ sở dữ liệu thô ?

Thật ra thì có hai khía cạnh khi bạn muốn trả lời thắc mắc ở trên:

1. Ai quan tâm ?

2. Và, tôi hy vọng đối thủ cạnh tranh của tôi lãng phí thời gian của họ tranh cãi về vấn đề này càng lâu càng tốt.

Còn bạn, bạn đang ở đây bởi vì bạn nghĩ rằng dữ liệu có thể là báo chí. Và vai trò của một nhà báo dữ liệu là việc đưa dữ liệu vào cuộc sống.

Tại sao điều này xảy ra ?

1) Công cụ: Trong quá khứ, dữ liệu chỉ là công cụ của các  nhà thống kê vì họ là những người duy nhất có khả năng phân tích dữ liệu ở mức cơ bản. Bây giờ mỗi máy tính trên thế giới có excel – và có rất nhiều lựa chọn thay thế miễn phí khác như : Numbers, bảng tính của Google và Open Office

2) Dữ liệu mở: Các chính phủ trên thế giới đã công bố hàng ngàn điểm dữ liệu, các dữ liệu miễn phí. Tuy nhiên, đối với một số chính phủ khác thì việc tìm kiếm dữ liệu là công việc khá khó khăn. Và không phải mọi người đều hiểu hết về các con số. Báo chí dữ liệu chỉ là một cách để tìm hiểu dữ liệu đó và mang nó đến với những người đang trả tiền cho việc thu thập dữ liệu.

3) Sự tin cậy: Hiện nay, với sự phát triển quá nhanh và rộng lớn của báo chí, công chúng đang mất dần sự tin tưởng vào các nhà báo. Việc cung cấp dữ liệu thô và dữ liệu mở  với những câu chuyện của bạn – về cơ bản là rõ ràng trong những gì bạn làm – khuyến khích công chúng tin tưởng hơn, nghĩa là bạn không có gì để che giấu công chúng cả. Chỉ là dữ liệu, thô và mở.

4) Công cụ (một lần nữa) – một khi bạn đã phân tích các dữ liệu, hiện nay có rất nhiều công cụ miễn phí và có sẵn mà phục vụ cho tất cả các cấp kỹ năng và cho phép bất cứ ai để tạo ra các bản đồ tương tác và trực quan: các công cụ như Google Fusion Tables, Datawrapper. Dữ liệu có thể được làm sạch bằng một công cụ miễn phí như Open Refine  – có thể giúp bạn làm sạch dữ liệu lộn xộn. Các công cụ đã giúp thay đổi bức tranh chung về báo chí dữ liệu.

Dữ liệu dẫn đầu

Làm thế nào để các nhà lãnh đạo báo chí dữ liệu trên thế giới làm được điều này ? Nhiều người đã là người chiến thắng trong các lễ trao giải Báo chí dữ liệu gần đây nhất và đại diện cho mỗi loại hình khác nhau của báo chí dữ liệu. Tất cả đều có chung những công thức:

Chỉ cần các sự kiện

Le Pariteur của WeDoData sử dụng một hình ảnh kỳ quặc, và một câu hỏi nhanh chóng và rất nhiều thông tin để so sánh và đối chiếu mức lương của nam giới và phụ nữ[2].

Ứng dụng thị giác này rất đơn giản.

Dữ liệu có thể được sử dụng để giúp mọi người tìm kiếm các thông tin quan trọng về nơi họ sinh sống, trường học, địa phương… Nó cho phép người sử dụng có được những thông tin công khai quan trọng của mọi người theo một cách tiếp cận dễ dàng và thoát ra khỏi sáng kiến ​​Code for Africa[3], nó buộc kỹ sư công nghệ gắn chặt với phòng tin  tức.

Dữ liệu dựa trên câu chuyện tin tức

Báo chí dữ liệu thường xuyên mang lại những câu chuyện bằng cách tiết lộ những con số đằng sau các tin tức. Mỗi câu chuyện sẽ có một số dữ liệu đi cùng với nó.

Một ví dụ điển hình đó là cách mà Pro-publica (http://projects.propublica.org/sopa/) đã làm[4]. Họ tập hợp dữ liệu và phân phối chúng miễn phí cho tấ cả các tờ báo có nhu cầu, theo một giấy phép riêng, nhiều câu chuyện của Pro-publica đã dành giải thưởng Pulitzer 2010, 2011…

Hoặc câu chuyện ứng dụng phân tích dữ liệu của AP trong việc đưa tin Kết quả bầu cử Tổng thống Mỹ năm 2012 cũng là một ví dụ điển hình. Ứng dụng này từ hãng tin AP http://hosted.ap.org/interactives/2012/election-trends/ chỉ là một ví dụ cho một tin tức dựa trên tương tác trong đó họ nén nhiều dữ liệu vào một hướng dẫn đơn giản để có thể tiên đoán kết quả bầu Tổng thống Mỹ năm 2012[5].

Thông qua công cụ này, các chiến lược gia trong chiến dịch ủng hộ của Đảng Dân chủ mới biết một cách nhanh chóng nhất là họ đã giành được sự ủng hộ của ba nhóm chính : nhóm thiểu số ( đặc biệt là các cử tri gốc Tây Ban Nha ) , phụ nữ và các cử tri trẻ để đảm bảo của Barack Obama tái đắc cử. Trong lịch sử, nhân khẩu học trọng điểm thường đóng vai trò then chốt trong cuộc bầu cử Tổng thống .

 

The Guardian Datablog[6], mà tôi sử dụng để chỉnh sửa, (Simon Roger) cũng chủ yếu là thông báo các thông tin xung quanh những tin tức, làm cho dữ liệu công bố công khai có giá trị hơn. Nó sử dụng công cụ miễn phí để hình dung dữ liệu – công cụ mà bất cứ ai có thể sử dụng, chẳng hạn như Google fusion tables hoặc Datawrapper.

Câu chuyện địa phương/Local data telling stories

Báo chí dữ liệu cung cấp một cơ hội tốt cho các toà báo địa phương với nguồn lực nhỏ. Giúp họ kể những câu chuyện trong cộng đồng của họ.

Một ví dụ của báo chí dữ liệu địa phương là giúp minh hoạ cho sự chênh lệch về thu nhập trong các khu phố ở thủ đô Washington . Đây thật ra là một dự án của nhóm vận động tranh cử được dẫn dắt bởi DC Action for Children, hợp tác với DataKind và một nhóm các nhà khoa học dữ liệu. Dự án sử dụng số liệu của cả Cục điều tra dân số Mỹ và dữ liệu hành chính địa phương về dân số và tài nguyên trong Quận Columbia. Cộng tác viên thu được số liệu về số lượng dân số và đặc điểm xã hội từ cuộc điều tra dân số mười năm một lần và Khảo sát cộng đồng Mỹ.

Phân tích và bối cảnh

Báo chí dữ liệu có nhiệm vụ giải thích những sự việc đằng sau các tin tức.

Các ứng dụng bao gồm các nghiên cứu sâu rộng vào tất cả 181 thành viên của cơ quan lập pháp Texas, cộng với các quan chức trên toàn tiểu bang. Nó có thể cung cấp một cách chi tiết về tất cả mọi thứ từ quá trình làm việc của một nhà lập pháp và các hồ sơ tài chính như việc họ nắm giữ các cổ phiếu nào, danh sách tài sản, dữ liệu tài chính và các cuộc điều tra đạo đức. Nó cũng chứa các phân tích của phóng viên – được thu thập và viết trong suốt chín tháng – cho thấy có thể có xung đột trong lợi ích cá nhân hoặc tài chính của một nhà lập pháp. Nói cách khác, đó là một sự kết hợp của dữ liệu công cộng và phân tích phóng viên. Và tất cả đều dựa trên bảng dữ liệu của Google.

Deep-dive investigations

Dữ liệu trong các cuộc điều tra sẽ làm góp phần tăng tính thuyết phục cho các bài báo của phóng viên.

 

[1] http://en.wikipedia.org/wiki/Adrian_Holovaty

[2] http://appli-parite.nouvelles-ecritures.francetv.fr/#

[3]Một sáng kiến trong đó sử dụng sức mạnh của dữ liệu để giúp người dân nắm giữ chính quyền và các tổ chức có trách nhiệm. (tìm hiểu thêm https://angel.co/code-for-africa)

[4] ProPublica là một phòng tin phi lợi nhuận, sản xuất báo chí điều tra vì lợi ích công cộng. Những người sáng lập tổ chức này thấy rằng, Báo chí điều tra đang gặp phải những nguy cơ. Nhiều nhà sản xuất tin tức ngày càng xem điều tra như là một sự xa xỉ. Phóng viên điều tra hiện nay thiếu các nguồn lực cả về thời gian và ngân sách. Do đó, rất cần một mô hình mới, để tiếp tục thực hiện sứ mệnh của báo chí vì lợi ích công cộng, và đó là một bức tường thành quan trọng của nền dân chủ.ProPublica đã được thành lập bởi Paul Steiger, biên tập viên quản lý cũ của The Wall Street Journal. Hiện nay nó đang được dẫn dắt bởi Stephen Engelberg, một cựu quản lý của The Oregonian và cựu biên tập viên điều tra của The New York Times, cùng với Richard TOFEL, cựu trợ lý của nhà xuất bản của The Wall Street Journal.

[5] http://hosted.ap.org/interactives/2012/election-trends/

[6] Mặc dù các báo cáo thực hiện với sự hỗ trợ của máy tính đã tồn tại từ những năm 1960, nhưng việc tăng cường các mối quan hệ giữa nhà báo và công nghệ dựa trên máy tính đã dẫn đến sự phát triển của một khái niệm rộng lớn hơn. Các tổ chức tin tức lớn đầu tiên áp dụng là The Guardian, trong đó họ đưa ra Datablog vào tháng Ba năm 2009. Bắt đầu từ nửa cuối năm 2010, số liệu báo chí đã được coi là có giá trị tham khảo cao trong các hội nghị và trong tạp chí khoa học. (Xem thêm tại đây: http://en.wikipedia.org/wiki/Data_journalism)

 

About Nguyễn Cường

Nguyễn Cao Cường là một nhà báo, giảng viên chuyên ngành truyền hình tại Trường Đại học Khoa học Xã hội & Nhân văn, ĐH Quốc gia Hà Nội. Các hướng nghiên cứu chính: truyền hình, truyền thông xã hội và quản trị truyền thông.

Bình luận

bình luận