Wiktionary


aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Belege Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.
Wiktionary
Das Logo des deutschsprachigen Wiktionary
Motto ein Wiki-basiertes freies Wörterbuch
Beschreibung Wikiprojekt zur Erstellung eines freien Wörterbuches sowie Thesaurus in jeder Sprache
Registrierung optional
Sprachen 172, darunter Deutsch, Französisch und Englisch
Eigentümer Wikimedia Foundation
Urheber einzelne angemeldete und nicht angemeldete Autoren
Erschienen Englische Version: 12. Dez. 2002

Deutsche Version: 001. Mai 2004

Das Wiktionary , n – Das freie Wörterbuch – ein Wiki-basiertes freies Wörterbuch“, wobei die oberste und unterste Passage „Wikiwörterbuch“ und „ein Wiki-basiertes freies Wörterbuch“ in grauer Schrift auf heller grauem Untergrund gesetzt sind.

Von den gut 434.000 Einträgen zum Stand vom 5. November 2015 waren in der Aufteilung nach Sprache der erklärten Wörter etwa 288.000 Einträge deutsch, 53.000 englisch, 17.000 polnisch, 16.000 italienisch und 11.000 französisch; die restlichen Einträge verteilten sich auf über 200 weitere Sprachen.<ref>Wiktionary:Statistik/Sprachenübersicht, abgerufen am 5. November 2015.</ref> Die Anzahl der Einträge relativiert sich angesichts der Praxis, auch für gebeugte Formen eigene Seiten anzulegen.

Englisch

Als erste Sprachversion wurde das englischsprachige Wiktionary am 12. Dezember 2002 gestartet. Brion Vibber legte das Wiktionary zunächst auf einer provisorischen URL wiktionary.wikipedia.org an, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde.<ref>Talk:Wiktionary/Archives/2002 bei meta.wikimedia.org, abgerufen am 13. September 2009.</ref> Im November 2005 wurden 100.000 Einträge erreicht, im August 2007 wurden es 500.000. Die Schwelle von 1 Million Einträgen wurde am 18. Oktober 2008 überschritten. Am 27. November 2009 waren es 1,5 Millionen Einträge, und den 3-millionsten Eintrag gab es am 23. Mai 2012.<ref>Wiktionary:Milestones beim englischsprachigen Wiktionary, abgerufen am 7. Januar 2013.</ref>

Unter den am 7. Januar 2013 vorhandenen etwa 3,2 Millionen Einträgen waren aufgeteilt nach Sprache der erklärten Wörter etwa 627.000 Einträge Latein, 488.000 italienisch, 487.000 englisch, 279.000 französisch, 245.000 spanisch und 109.000 finnisch; der Rest verteilte sich auf weit über 400 weitere Sprachen.<ref>Wiktionary:Statistics, abgerufen am 7. Januar 2013 (Version vom 19. August 2011).</ref>

Französisch

Am 29. März 2004 wurde das französischsprachige Wiktionary oder Wiktionnaire ins Leben gerufen. Mittlerweile weist es über 2,3 Millionen Einträge auf und ist damit nach der englischen Version auf Platz 2 der umfangreichsten Sprachversionen des Wiktionary. Von den am 7. Januar 2013 vorhandenen 2,30 Millionen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 1,2 Millionen Einträge französisch, 157.000 russisch, 156.000 bulgarisch, 121.000 englisch und 80.000 slowenisch; der Rest verteilte sich auf über 900 weitere Sprachen.<ref>Wiktionnaire:Statistiques, abgerufen am 20. August 2011 (Version mit Stand vom 28. Juli 2011).</ref>

Datei:Wzrost Wikislownika.svg
Wachstumskurve des polnischsprachigen Wiktionarys

Vietnamesisch

Das Wiktionary in vietnamesischer Sprache wurde 2004 gegründet. Von den mittlerweile über 230.000 vorhandenen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 110.000 englisch, 44.000 französisch, 35.000 russisch und 31.000 vietnamesisch; der Rest verteilte sich auf 54 weitere Sprachen.<ref>Wiktionary:Thống kê im vietnamesischsprachigen Wiktionary, abgerufen am 15. September 2009.</ref>

Polnisch

Das polnischsprachige Wiktionary wurde im März 2004 ins Leben gerufen. Von den am 20. August 2011 vorhandenen etwa 236.000 Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 35.000 Einträge englisch, 30.000 polnisch, 21.000 chinesisch und 19.400 in der Plansprache Interlingua; der Rest verteilte sich auf 264 weitere Sprachen.<ref>Wikisłownik:Statystyka im polnischsprachigen Wiktionary, abgerufen am 20. August 2011 (Version mit Stand vom 16. August 2011).</ref> Die zirka 7.900 Einträge in jiddisch machen das polnische Wiktionary nach eigener Darstellung<ref>Portal:Jidysz/pl/mainpage im polnischsprachigen Wiktionary, abgerufen am 17. September 2009.</ref> zum größten modernen Wörterbuch der Nachkriegszeit für Jiddisch, das in Polen ‚herausgegeben‘ wurde. Knapp 6.000 dieser Einträge entstanden 2007 durch eine Bot-Aktion (siehe das Kapitel über Wachstumsschübe durch Bots).

Wachstumsschübe durch Bots

Datei:Wiktionary growth.png
Wachstumskurve der 8 größten Sprachversionen des Wiktionary bis März 2008. Die Wachstumssprünge durch den Einsatz von Bots sind deutlich erkennbar.

Die meisten Einträge in den umfangreichsten Sprachversionen des Wiktionary sind durch den Einsatz von Bots entstanden. Ihre Programmierer fanden kreative Wege, um große Zahlen neuer Einträge zu generieren oder tausende von Einträgen aus öffentlich zugänglichen Wörterbüchern maschinell zu importieren.

Sieben der mittlerweile über 30 Bots, die beim englischsprachigen Wiktionary als solche gelistet sind,<ref>Siehe Special:Listusers beim englischsprachigen Wiktionary.</ref> haben dort etwa 163.000 Einträge neu erstellt.<ref>Aussage auf Wiktionary in der englischsprachigen Version, abgerufen am 2. September 2009; angegeben werden folgende Bearbeitungszähler für 5 Bots: TheDaveBot, TheCheatBot, Websterbot, PastBot, NanshuBot. Allerdings ist hier zu beachten, dass nicht jeder Edit eine Neuanlage eines Eintrags darstellt.</ref> 259 Komplex-Einträge, die selbst viele Definitionen enthalten, wurden von Websterbot aus öffentlich verfügbaren Quellen importiert; die meisten dieser Importe sind manuell in Tausende Einträge gesplittet worden. Ein weiterer dieser Bots, ThirdPersBot, erstellte Verbnebenformen in der dritten Person Singular, die in gedruckten Wörterbüchern üblicherweise nicht einzeln aufgeführt werden. Zur Zeit dieser Aktionen im Jahr 2006 hatte das englischsprachige Wiktionary ohne die etwa 163.000 Bot-Einträge etwa 137.000 Einträge und war damit noch deutlich kleiner als viele gedruckte Wörterbücher: So umfasst das Oxford English Dictionary etwa 615.000 Worteinträge und das Merriam-Webster’s Third New International Dictionary of the English Language, Unabridged 475.000 Einträge; dabei sind viele Wortwendungen nur im Textkörper anderer Einträge vorhanden.

Die Wiktionarys in englischer und französischer Sprache haben die zirka 20.000 Einträge der Unihan-Datenbank der CJK-Schriftzeichen (chinesisch, japanisch und koreanisch) importiert.

Auch das rapide Wachstum des französischsprachigen Wiktionarys im Jahr 2006 geht hauptsächlich auf die Arbeit von Bots zurück, die viele Einträge aus alten, lizenzfreien Wörterbüchern wie der 8. Ausgabe des Dictionnaire de l’Académie française von 1935 mit rund 35.000 Worteinträgen übernahmen, sowie von Bots, die Begriffe aus anderen Sprachausgaben des Wiktionary mit französischen Übersetzungen importierten. Das französisch- wie das vietnamesischsprachige Wiktionary haben große Teile des Free Vietnamese Dictionary Project (FVDP)<ref>Free Vietnamese Dictionary Project (FVDP) bei der Universität Leipzig.</ref> importiert. Dieses bietet frei zugängliche zweisprachige Wörterbücher von und ins Vietnamesische an.<ref>Für Details siehe auch Wiktionary:Nguồn gốc/FVDP beim vietnamesischen Wiktionary.</ref> Das vietnamesischsprachige Wiktionary bestand nach dieser Aktion fast ausschließlich aus diesen importierten Einträgen.

Das Wiktionary in polnischer Sprache hat mit Hilfe des Bots Tsca.bot<ref>Siehe Tsca.bot im polnischsprachigen Wiktionary.</ref> im Zeitraum vom 10. Juli bis zum 27. November 2004 zirka 15.000 Stummeleinträge der Plansprache Interlingua mit Genehmigung des Autors von der Webpräsenz interlingua.filo.pl importiert.<ref>Eintrag des ersten Wortes (abandonamento) und Eintrag des letzten Wortes (tic-tac) durch Tsca.bot aus der Quelle http://interlingua.filo.pl./</ref> Mit Hilfe desselben Bots Tsca.bot wurden vom 31. März bis zum 2. April 2007 knapp 6.000 Einträge in jiddischer Sprache angelegt, die zumeist neben der polnischen Übersetzung die IPA-Aussprache und die YIVO-Transkription enthielten.<ref>Eintrag des ersten Wortes (שפּאַס) und Eintrag des letzten Wortes (שראַם) durch Tsca.bot.</ref>

Das russischsprachige Wiktionary übernahm mit Hilfe des Bots LXbot ab Oktober 2006 etwa 80.000 Stummeleinträge („Boilerplates“) für englische, deutsche und französische Wörter.<ref>triskaidekaphobia, erster Eintrag dieser Art durch LXbot.</ref><ref name="LXbot">Bearbeitungszähler für LXbot.</ref><ref>Siehe Diskussionsabschnitt ru:User:LXbot bei User talk:VPliousnine im englischsprachigen Wiktionary.</ref> Ab Juni 2008 wurden durch den Bot TrudoBot in hoher Zahl Stummeleinträge für russische Wörter erstellt.<ref>Участник:TrudoBot im russischsprachigen Wiktionary.</ref>

Bedeutung

Sprachübergreifend gesehen wird wiktionary.org von Alexa Internet im sogenannten „Alexa Traffic Rank“ auf Rang 851 (Stand: 4. November 2015) geführt.<ref>wiktionary.org bei Alexa, abgerufen am 6. November 2015.</ref> Von den registrierten Zugriffen erfolgten nach Sprachversion etwa 45 % auf die englische, 15 % auf die französische, 14 % auf die russische sowie 6 % auf die deutsche Version; der Rest verteilte sich auf die vielen weiteren Sprachversionen.

Bewertung

2005 wurde im Buch Das Internet und der autonome Lerner: Kostenlose Lehr-/Lernangebote im Internet für die englischsprachige Version des Wiktionary kritisiert, dass die Richtigkeit für Laien nicht nachvollziehbar ist, die Einträge unvollständig seien, Informationen zur Aussprache der Wörter meist fehlten sowie Audio-Beispiele nur manchmal vorhanden seien und Übersetzungen in andere Sprachen oft nicht verfügbar seien.<ref>Das Internet und der autonome Lerner: Kostenlose Lehr-/Lernangebote im Internet. books.google.de</ref>

Ontology Learning and Knowledge Discovery Using the Web führt wissenschaftliche Untersuchungen über das englischsprachige Wiktionary aus den Jahren 2006 bis 2009 auf. Gegenüber WordNet wird positiv hervorgehoben, dass das englischsprachige Wiktionary auch Einträge von Kompositionen, Akronymen, Abkürzungen, Fehlschreibungen und vereinfachten Schreibweisen gestattet. Als Nachteile wurden in einer Untersuchung von Navarro et al. aus dem Jahr 2009 unvollständige, fast leere Einträge, die ungleiche Gewichtung der Sprachen und die geringe Anzahl von verzeichneten Synonymen bemängelt.<ref>Ontology Learning and Knowledge Discovery Using the Web, Seite 87 books.google.de</ref>

Im Jahr 2012 erschien das Buch Electronic Lexicography mit welchem festgestellt wurde, dass Wiktionary im Vergleich zu WordNet besser abschneidet, wenn es darum geht, die Bedeutung der Einträge nach der geläufigsten Verwendung aufzuführen. Die Zuordnung von Wörtern nach bestimmten Merkmalen wie Fachgebiet, linguistischer Varietät, zeitlicher und regionaler Einordnung, wird für die englischsprachige Version besser bewertet als in der deutsch- und russischsprachigen, weil dort mehr Einträgen mindestens ein Merkmal zugeordnet worden ist, als dies in der deutschen und russischsprachigen Variante der Fall gewesen ist. Hervorgehoben wird, dass sich die Mehrheit der Zuordnung der Wörter nach Merkmalen auf Fachgebiete bezieht, woraus die Untersuchung auf das Mitwirken von entsprechenden Fachleuten schließt. Wiktionary wird als Konkurrent von durch Experten generierten Lexika angesehen, das eine Vielzahl von Anwendungsmöglichkeiten eröffne.<ref>Electronic Lexicography, S. 287 ff. books.google.de</ref>

Literatur

  •  Kai-Uwe Carstensen, Christian Ebert, Susanne Jekat, Cornelia Ebert, Hagen Langer, Ralf Klabunde (Hrsg.): Computerlinguistik und Sprachtechnologie. Eine Einführung. 3. Auflage 2010 Auflage. Spektrum Akademischer Verlag, Heidelberg, ISBN 978-3-8274-2023-7 (insbesondere S. 548–550).
  •  A. Elia: Can a collaborative Wiki Weblish Dictionary Project help academic writing of ICT language learners?. In: Isabel González-Pueyo, Carmen Foz Gil, Mercedes Jaime Siso, Marco Luzón, María José (Hrsg.): Teaching Academic and Professional English Online. Peter Lang Publishing Group, 2009, ISBN 978-3-03911-582-2.

Weblinks

Wiktionary Wiktionary: Wiktionary – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen
Commons Commons: Wiktionary-Statistiken – Sammlung von Bildern, Videos und Audiodateien
Commons Commons: Wiktionary-Logos – Album mit Bildern, Videos und Audiodateien

Wiktionary Wiktionary auf deutsch – ein freies Wörterbuch.

Einzelnachweise

<references />