tisdag 11 januari 2011

Hur Visualisera dig 100 GB Google Text Data?

Intressanta nyheter ses i http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
En anonym läsare skriver: "Det är en fantastisk serie diagram som visualiserar trigrams och bigrams, delar av meningar som har extraherats från Googles webbplats datamängd. Diagrammen markera ord föreningar och frekvensen med vilken vi använder dem på webbsidor. Chris Harrison från Carnegie Mellon University fann till exempel att ordet "han" är ofta knutna till "hävdar", medan är "hon" som ofta hittas med "älskar". Det finns också ord-förhållande diagram för att belysa ord som används i kombination med deras motsatser, som gott och ont, fred och krig, och PC och Mac. " Det finns många av dessa saker, och de är verkligen intressant att bläddra igenom.

Läs mer i denna historia på Slashdot.




Inga kommentarer:

Skicka en kommentar