Factual, eine neue Plattform für Open Data

Tabelle im Browser
Foto: Screenshot factual.com
Tabelle im Browser
Foto: Screenshot factual.com
Factual, eine Web-2.0-Plattform für die Auswertung und Verteilung von Daten und Statistiken, ist als öffentliche Beta freigeschaltet worden. Die Firma selbst spricht von "Open data" und beackert damit ein ähnliches Feld wie die bereits 2007 gestartete Freebase, die sich selbst als "open database of the world’s information" beschreibt.

Während Freebase sich auf den ersten Blick wie eine Suchmaschine anfasst, verhehlt Factual nie seine Datenbank-Struktur: Daten lassen sich nicht nur auf der Website im Browser durchsuchen und anzeigen. Sie können auch auf anderen Websites eingebettet werden, wobei die Darstellung in Tabellenform übersichtlich, aber rudimentär ist. Richtig interessant wird es erst, wenn Daten über eine sogenannte API abgerufen und mit anderen Datenquellen vermischt ("mashup") werden.

Eingebettete Beispiel-Tabelle: zum Tode verurteilte Häftlinge


Beim Import vermag Factual - neben der Verarbeitung typischer Tabellenformate (Excel, Open Office, CSV) - die Daten auch aus HTML-Seiten zu extrahieren. Neue Daten können mit existierenden vermischt werden, wobei Factual nach Angaben der Entwickler selbst Zusammenhänge erkennt.

Datenquelle für CAR
Mit diesen Kernkompetenzen hat Factual das Zeug, eine sprudelnde Datenquelle für moderne Web-Anwendungen zu werden - sofern genug Anwender sie auffüllen. Vom intelligenten Umgang mit Daten dürftte auch das sogenannte Computer Assisted Reporting (CAR) profitieren: Journalisten und Medien könnten (Verbrechens-, Bevölkerungs-, Haushalts-) Statistiken anlegen, visualisieren, publizieren und unter verschiedenen Fragestellungen auswerten. So nutzt das Wall Street Journal Freebase, um seine Filmkritiken online mit Zusatzinformationen aus einer Kino-Datenbank anzureichern - zugegeben eine eher leichtgewichtige Anwendung im Vergleich zu den Möglichkeiten, die komplexes Datamining bietet.

Zu den Besonderheiten von Factual gehört, wie einzelne Daten bearbeitet und versioniert werden. Werden Felder geändert oder kommt es bei der Zusammenführung von Tabellen aus verschiedenen Datenquellen zu unterschiedlichen Ergebnissen, dann macht Factual mit einem Fragezeichen deutlich, dass verschiedene Angaben existieren. Ein Doppelklick auf das Feld zeigt, welcher Benutzer welche Angabe gemacht hat. Anders als bei der Wikipedia wird nicht die letzte Änderung angezeigt, sondern die von der Mehrzahl der Nutzer favorisierte.

Offen und bislang kostenlos
Der Begriff "Open Data" impliziert, dass die eingegeben Daten allen Nutzern zur Verfügung stehen - das könnte ein Hindernis für Journalisten und Medien sein, die ihr Material entgegen dem kollaborativen Gedanken nicht freigeben wollen. Nicht ganz "open" ist dagegen der Passus in der FAQ-Sektion der Website, wonach sich die Betreiber vorbehalten, künftig bestimmte Funktionen nur noch kostenpflichtig zur Verfügung zu stellen.

Hinter Factual steht übrigens Gil Elbaz, Mitgründer der Firma Applied Semantics, die 2003 von Google gekauft wurde. Der Suchmaschinen-Konzern nutzte das erworbene Know-how für seine AdSense-Technologie, die je nach Seiteninhalt passende automatische Werbeeinblendungen ermöglicht.