XT Knowledge Base
Hauptseite | Über | Hilfe | FAQ | Spezialseiten | Anmelden

Druckversion | Impressum | Datenschutz | Aktuelle Version

Wayati FAQ

(Unterschied zwischen Versionen)

(Generelle Struktur)
(Wayati.com)
 
(Der Versionsvergleich bezieht 18 dazwischenliegende Versionen mit ein.)
Zeile 1: Zeile 1:
= Wayati.com =
= Wayati.com =
== Was ist der Zweck von Wayati.com? ==
== Was ist der Zweck von Wayati.com? ==
-
Wayati.com ist ein WebService, mit dem man Spammer aus seiner Friendlist herausfiltern kann. Um herauszufinden, ob es sich bei einem Twitter-Account um einen Spammer bzw. Annoying User handelt, wurde ein spezieller Algorithmus entwickelt, der aufgrund der Struktur der Tweets erkennen kann, ob und wie lästig ein Twitter-User ist.  
+
[http://wayati.com Wayati.com] ist ein WebService, mit dem man Spammer aus seiner Friendlist herausfiltern kann. Um herauszufinden, ob es sich bei einem Twitter-Account um einen Spammer bzw. Annoying User handelt, wurde ein spezieller Algorithmus entwickelt, der aufgrund der Struktur der Tweets erkennen kann, ob und wie lästig ein Twitter-User ist.  
Darüber hinaus ist Wayati.com als Technikstudie gedacht, wobei es darum geht, eine sinnvolle Klassenbibliothek für PHP zu entwickeln, mit der man schnell und möglichst komfortabel komplexe Webanwendungen erstellen kann.
Darüber hinaus ist Wayati.com als Technikstudie gedacht, wobei es darum geht, eine sinnvolle Klassenbibliothek für PHP zu entwickeln, mit der man schnell und möglichst komfortabel komplexe Webanwendungen erstellen kann.
-
Wayati.com ist noch in der Entwicklung. Bisher ist es nur möglich, einzelne Benutzer von dem Dienst bewerten zu lassen.
+
[http://wayati.com Wayati.com] ist noch in der Entwicklung. Bisher ist es nur möglich, einzelne Benutzer von dem Dienst bewerten zu lassen.
== Was bedeutet Wayati? ==
== Was bedeutet Wayati? ==
Zeile 13: Zeile 13:
Der Algorithmus untersucht hauptsächlich die Struktur der Tweets. Der Inhalt wird nicht bewertet, daher funktioniert der Algorithmus sprachunabhängig. Zum Beispiel werden Tweets schlecht bewertet, wenn Aufzählungen von Usern, viele Hashtags oder Wörter, die nur aus Großbuchstaben bestehen. Auch Tweet-übergreifend erkennt der Spamchecker, wenn jemand komplette Tweets ständig wiederholt oder den gleichen Text an verschiedene User schickt.  
Der Algorithmus untersucht hauptsächlich die Struktur der Tweets. Der Inhalt wird nicht bewertet, daher funktioniert der Algorithmus sprachunabhängig. Zum Beispiel werden Tweets schlecht bewertet, wenn Aufzählungen von Usern, viele Hashtags oder Wörter, die nur aus Großbuchstaben bestehen. Auch Tweet-übergreifend erkennt der Spamchecker, wenn jemand komplette Tweets ständig wiederholt oder den gleichen Text an verschiedene User schickt.  
-
Folgende Tests werden durchgeführt:
+
== Was bedeuten die einzelnen Werte und wie kommen sie zustande? ==
-
=== Generelle Struktur ===
+
Eine detaillierte Beschreibung der einzelnen Werte befindet sich [[Wayati Bewertungsdetails|hier]]
-
Die Tweets werden in Einzelteile zerlegt und es wird untersucht, ob User, Links, Hashtags und "Geschrei", also Wörter, die nur aus Großbuchstaben bestehen und länger als drei Buchstaben sind (Abkürzungen) vorkommen. Zusammenhängender Text wird als ein Element betrachtet.
+
-
 
+
-
Zum Beispiel "@userxy Bei uns regnet es heute. #wetter" besteht aus drei Elementen: User, Text, Hashtag (UTH)
+
-
Die meisten bestehen nur aus Text (T) oder Text, Hashtag (TH), User, Text (UT) oder Text, Link (TL) oder Text, Link, Hashtag (TLH) und weisen somit eine recht übersichtliche Struktur auf.
+
-
 
+
-
Typische Spam-Tweets sehen so aus: "easy money making: http://tinyurl.com/ltjqvt @bbqmaven @Chodidees @TheAngryDude @hownottowrite". Die Elemente sind Text, Link, User, User, User, User (TLUUUU)
+
-
Besonders nervig ist zum Beispiel folgendes: "RT @LouisLeBeau: #MM best @LavaLampLV @Oscar_LeChat @Dunkin_the_Cat @TPPCtv @zeepeters @Lorenzothecat @buschpetproduct @MyTuxedoCat @MaxTheD": RT, User, Hashtag, Text gefolgt von 9 Usern (RUHTUUUUUUUUU)
+
-
 
+
-
Der Struktur-Test bewertet die durchschnittliche Länge dieser Strukturbeschreibungen.
+

Aktuelle Version vom 09:48, 23. Sep. 2009

Inhaltsverzeichnis

Wayati.com

Was ist der Zweck von Wayati.com?

Wayati.com ist ein WebService, mit dem man Spammer aus seiner Friendlist herausfiltern kann. Um herauszufinden, ob es sich bei einem Twitter-Account um einen Spammer bzw. Annoying User handelt, wurde ein spezieller Algorithmus entwickelt, der aufgrund der Struktur der Tweets erkennen kann, ob und wie lästig ein Twitter-User ist.

Darüber hinaus ist Wayati.com als Technikstudie gedacht, wobei es darum geht, eine sinnvolle Klassenbibliothek für PHP zu entwickeln, mit der man schnell und möglichst komfortabel komplexe Webanwendungen erstellen kann.

Wayati.com ist noch in der Entwicklung. Bisher ist es nur möglich, einzelne Benutzer von dem Dienst bewerten zu lassen.

Was bedeutet Wayati?

Wayati ist ein Kunstwort und ist die Abkürzung für "Waste ya (your) time". Twitter ist ein Zeitvertreib, dessen praktischer Nutzen für viele beschränkt ist, selbst wenn er für wenige durchaus vorhanden ist. Wayati.com hat das Ziel, diese potentielle Zeitverschwendung angenehmer zu machen, in dem die lästigen Nervensägen entfernt werden, um den Spaßfaktor zu erhöhen.

Wie funktioniert die Spam-Erkennung?

Der Algorithmus untersucht hauptsächlich die Struktur der Tweets. Der Inhalt wird nicht bewertet, daher funktioniert der Algorithmus sprachunabhängig. Zum Beispiel werden Tweets schlecht bewertet, wenn Aufzählungen von Usern, viele Hashtags oder Wörter, die nur aus Großbuchstaben bestehen. Auch Tweet-übergreifend erkennt der Spamchecker, wenn jemand komplette Tweets ständig wiederholt oder den gleichen Text an verschiedene User schickt.

Was bedeuten die einzelnen Werte und wie kommen sie zustande?

Eine detaillierte Beschreibung der einzelnen Werte befindet sich hier