Update 2018: Dict.cc wurde vor einigen Monaten schon 15 Jahre alt. Grund genug dieses Interview noch mal aus der Versenkung zu holen und in neuem Licht zu präsentieren. Das Deutsch-Englisch Wörterbuch verfügt mittlerweile über mehr als 1’100’000 Einträge und ist somit seit der Veröffentlichung dieses Interviews um über 400’000 Einträge gestiegen. Massiv! Zudem kamen unzählige neue Sprachen dazu (Finnisch erreichte vor Kurzem 30’000 Einträge). Zudem gibt es neben den klassischen Deutsch-(Sprache) jetzt auch Englisch-(Sprache) Wörterbücher, wenn du von Englisch in eine andere Sprache übersetzen möchtest. Das Interview wurde ursprünglich im März 2009 veröffentlicht.

Paul Hemetsberger ist der Betreiber von dict.cc, einem online Englisch Wörterbuch, welches mit 688.971 mehr Einträge hat als das bekannte LEO (Artikel zu dict.cc bei SLweb). Über 8’000 User helfen mit, dass dict.cc täglich um 300 Einträge wächst. Im Forum finden sich über 400’000 Posts und täglich werden die Seiten von dict.cc ca. 3 Millionen mal aufgerufen. Ein sehr interessantes Projekt, weshalb ich Paul einige Fragen stellte, welche er mir ausführlich beantwortete.

Wie kamst du auf die Idee ein online Wörterbuch zu starten und was war dabei dein Ziel?

Die Grundidee war kein Fremdsprachenwörterbuch, sondern eine Art Glossar oder Lexikon mit kurzen Definitionen, ähnlich dem Prinzip von Google Knol. Diese Funktion erfüllt aber mittlerweile seit Jahren die Wikipedia.

Ich hatte die Idee schon vor langer Zeit, einige Zeit vor der Wikipedia (und lange vor Google), nämlich 1998. Leider waren damals meine Programmierkenntnisse noch nicht gut genug, deshalb habe ich in der Zwischenzeit einige Jahre als angestellter, bzw. selbstständiger Web-Entwickler gearbeitet und Knowhow gesammelt.

Irgendwann stieß ich dann zufälligerweise auf die Vokabelliste der TU-Chemnitz und mit der Erlaubnis des Rechteinhabers (Frank Richter) habe ich mein Konzept dann auf ein Fremdsprachenwörterbuch angewendet.

Mein Ziel war und ist nach wie vor, das mittlerweile funktionierende Konzept auf andere Sprachen auszuweiten und so etwas wie „die Wikipedia für Sprachen“ aufzubauen.

Mittlerweile ist dict.cc ja umfangreicher als das sehr bekannte LEO (Deutsch-Englisch). Erfüllt dich das ein wenig mit stolz?

Das erfüllt mich auf jeden Fall mit Stolz. Gleichzeitig bringt es allerdings auch Probleme mit sich. Wenn Suchergebnisseiten sehr lang werden, kann es passieren, dass die wichtigen Übersetzungen unter den weniger wichtigen nicht gefunden werden. Um das zu lösen, verwende ich jetzt statistische Daten aus dem Online-Vokabeltrainer von dict.cc, um die Übersetzungen nach Wichtigkeit zu reihen.

Sind die Besucher von dict.cc eher Deutsch- oder Englischsprachig?

Die meisten sind deutschsprachig, ich habe aber den Eindruck, dass in letzter Zeit mehr Amerikaner auf dict.cc aufmerksam werden. Der Löwenanteil der Besucher (über 70%) kommt aus Deutschland, danach kommt Österreich, die USA, die Schweiz und dann Großbritannien.

Bei dict.cc kann sich ja jeder beteiligen. Wie viele User haben in etwa aktiv bei der Erweiterung des Wörterbuches geholfen?

Das sieht man unter http://users.dict.cc/hall-of-fame/. Derzeit sind es 8043 registrierte Benutzer (von insgesamt 47312 registrierten Benutzern). Dazu kommen noch viele unregistrierte Benutzer, die beispielsweise Fehler melden oder beim Überprüfungsprozess mitmachen.

Wie schützt du dict.cc vor Spam oder Falscheinträgen?

Gegen automatisierten Spam (Spambots) durch eine Kombination von
technischen Maßnahmen (Javascript, unsichtbare Eingabefelder, Captchas). Gegen absichtlichen, menschlichen Spam hilft nur menschliche Kontrolle. Man kann Forum-Postings und Benutzer als Spammer markieren, eine gewisse Anzahl von markierenden Benutzern vorausgesetzt wird das Posting oder der Benutzer automatisch gesperrt. Ich bekomme dann eine Nachricht per E-Mail und kannn die Sperre im Notfall auch wieder aufheben.

Das Wortschatzsystem selbst ist aber noch genauer. Jeder neue Eintrag muss von mehreren Benutzern geprüft werden, um als verifiziert zu gelten. Die Prüfung können unregistrierte oder registrierte Benutzer machen. Die Stimme eines registrierten Benutzers zählt so viel wie die von zwei unregistrierten. Als registrierter Benutzer verdient man durch korrekte Prüfvorgänge Punkte, die dann in eine sogenannte „Voting Power“ umgerechnet werden. Die besten Benutzer haben eine „Voting Power“ von 5, deren Stimme zählt also so viel wie die von fünf unregistrierten Benutzern.

Dieses System hat sich sehr gut bewährt – mittlerweile kommt so gut wie kein fehlerhafter Eintrag mehr durch. In den seltenen Fällen, wo doch ein Tippfehler übersehen wird, wird der innerhalb von wenigen Stunden von Benutzern erkannt und korrigiert.

Ich habe auch gelesen, dass du dir vorstellen kannst, dict.cc in allen möglichen Sprachen anzubieten. Gibt es dazu konkrete Pläne?

Das war von Anfang an geplant und daran arbeite ich auch jetzt noch. Mittlerweile ist es natürlich schwieriger, das Vorhaben umzusetzen, denn jetzt muss ich viele, teilweise versteckte Zusatzfunktionen in die Programmierung miteinbeziehen, ganz abgesehen von der komplizierteren Infrastrukur, die ich jetzt habe (10 Server parallel und es werden ständig mehr).

Ich arbeite immer daran, wenn nicht andere, momentan wichtigere Probleme zu lösen sind. Ich hoffe, in ein paar Monaten technisch weit genug zu sein, um eine Betaversion veröffentlichen zu können, aber versprechen kann ich das leider nicht.

Auf deiner Website habe ich auch gelesen, dass du dich nur noch um dict.cc kümmerst und keine Aufträge von Kunden mehr annehmen kannst. Machst du das Projekt ganz allein oder hast du Mitarbeiter?

An sich betreibe ich das Projekt alleine und kümmere mich um Dinge wie Benutzerbetreuung, Serverwartung, Fehlerbehebung, Finanzierung und die Weiterentwicklung (Konzept, Layout, Programmierung).

Ich arbeite allerdings nicht alleine an dict.cc – viele treue Benutzer
arbeiten schon seit Jahren zusammen an der Verbesserung des
Wortschatzes, helfen im Forum oder tragen Sprachaufnahmen bei. Ohne die aktiven Teilnehmer wäre dict.cc nicht möglich, deshalb möchte ich die Gelegenheit ergreifen, hier einmal „danke“ zu sagen! Vielen Dank an alle Benutzer, die bei dict.cc mitarbeiten!

Was wünschst du dir in Zukunft für dict.cc?

Ich wünsche mir, dass ich die Spracherweiterung endlich schaffe und dass dict.cc dann auch in den anderen Sprachen wächst und vielleicht wirklich irgendwann die „Übersetzungs-Wikipedia“ wird.

Vielen Dank Paul für diese interessanten Informationen. Ich wünsche dir weiterhin viel Erfolg mit dict.cc. Und an alle Leser, es lohnt sich ganz bestimmt sich dieses Projekt einmal genauer anzusehen.