Riv hierarkierna – tagga istället

Detta är del 1 i en serie som jag har skrivit rörande information och vetenskap. De innehåller förslag på hur man i framtiden skulle kunna hantera information, kunskap och vetenskap på ett bättre sätt.

Del 2 – Spindelforskning

Handlar om hur forskaren hanterar andras forskning. Något som är en vital del i skapandet av ny kunskap. Och som har sett likadant ut väldigt länge. Dags att ändra på, med andra ord.

Del 3 – Wiki Science

Handlar om hur vetenskapliga publikationer baseras på metaforen ”bok” och har sprungits förbi av till exempel wiki-formatet.

Har ni någon gång tänkt på hur vi organiserar kunskap? Hur vi katalogiserar information och hur vi säkerställer att vi – eller någon annan – kan hitta rätt bit av data vid ett senare tillfälle?

Det har jag. En hel del de senaste 10-12 åren, faktiskt. Det började när jag i min forskning intresserade mig för cybernetik och systemvetenskap. Och för hur man kan organisera och visualisera oerhört komplexa system med hjälp av enkla byggstenar. Dessa byggstenar som jag för övrigt visade inte var något annat än klasser (som i objektorientering).

Inom datorvetenskapen har objektorienteringen utvecklats sedan mitten på 1960-talet (Simula 66 sägs vara det första objektorienterade programspråket). Parallellt hade matematiker och informationsteoretiker utvecklat cybernetiken (som inte har ett dugg med Arnold Schwarzenegger eller terminator att göra). Centralt inom både objektorienteringen och cybernetiken är idén om ett enkelt gränssnitt som enda kanal till och från ett inkapslat system (Black Box i cybernetik, Klass/Objekt i objektorientering).

Nåväl. I samma veva som jag började intressera mig för dessa båda ämnesområden släpptes Outlook-97. Och då upptäckte jag Microsofts kanske största grej hittills: kategorierna. I Outlook organiseras allt normalt i mappar. Och helt plötsligt inför de dessa kategorier. Nu kunde en kontakt tillhöra flera kategorier samtidigt, och varje kategori kunde ha flera objekt. Och plötsligt var det något som klickade till.

Traditionellt organiserar människan information hierarkiskt. Det är enkelt att förklara och enkelt att utföra. Se på filsystemet i en dator. En rotkatalog med ett antal underkataloger, som i sin tur har fler underkataloger etc. Så ser nästan all organisation av information ut. Bibliotek har avdelningar och sedan ämnesord för att katalogisera sina böcker. Därav behovet av sökmotorn. En sökmotor bryr sig inte om hierarkier, den indexerar alla ord på till exempel en webbsida och när någon sedan söker på ett visst ord hittar sökmotorn förhoppningsvis originallänken – kopplad till sökordet.

Att – som Google vill – söka istället för att leta har gjort oss beroende av sökmotorerna. Vi använder dem för att leta upp all tänkbar information och bryr oss inte om att vare sig katalogisera eller att bygga hierarkier längre. Finns ingen anledning, det är ju bara att söka! Jag menar att det visst finns en anledning att fortsätta att organisera och katalogisera information. Och att själva handlingen att organisera är nästan ett självändamål som hjälper oss att hitta mönster och sammanhang.

Luddigt? Vänta bara!

Jag ska ge er två exempel.

Det första exemplet är en sökväg till ett dokument på en hårddisk:

/Dokument/Jobbgrejer/Projekt/Alfa/Källmaterial/Böcker/Casti-alternate_realities.pdf

Den pekar på en PDF av en bok som användes som källmaterial i ett projekt.

Ta en stund och bläddra på din hårddisk. Du känner igen dig, eller hur?

Mitt andra exempel är samma dokument, nu taggat istället för placerat i en sökväg:

Casti-alternate_realities.pdf
Tags: [Dokument] [Jobbgrejer] [Projekt] [Alfa] [Källmaterial] [Böcker]

Vad är då skillnaden mellan dessa två metoder att organisera? Inte särskilt stor, tänker du. Gigantisk, säjer jag.

Grunden i hierarkiska filsystem är några få, enkla, strikta regler, varav den viktigaste är att ingen mapp och inget dokument får ha mer än en ”förälder”. Den hierarkiska organisationen innebär att varje bit information måste kategoriseras exakt rätt. Lägger du filen som hör till ”Projekt Alfa” i mappen för ”Projekt Beta” är den borta. Det går inte att från en gren i en hierarki se in i en annan.

I ett taggbaserat filsystem har man alla friheter. Man kan lägga till nya taggar utan att störa de befintliga. Jämför med att flytta ett dokument i det klassiska filträdet. Där var man tvungen att skapa en kopia av dokumentet om man ville att det skulle finnas på mer än ett ställe i hierarkin. Vill man visa sina taggade filer i en hierarki går detta utmärkt. Man bestämmer bara vilken av taggarna som skall vara rotnivå. Sedan är det bara att låta informationen organisera sig själv. Dokumentet i exemplet ovan skulle återfinnas på flera ställen i ”filträdet” eftersom det har 6 föräldrar. Men det gör inget. Nu kan man bläddra hur man vill. Man hittar alltid sitt dokument, oavsett vilka taggar man väljer att leta under.

Som ett komplement till sökmotorerna skulle alltså taggbaserade filsystem kunna spela en stor roll i hur vi organiserar information. Se bara på bloggarna. Och kolla in mitt snygga taggmoln här till höger. Enda gången jag använder hierarkiska begrepp är när en kategori ärver från en förälder, till exempel kategorin Färger har underkategorierna Röd och Blå. Om jag väljer Blå har jag också automatiskt valt kategorin Färger.

Ett full utbyggt taggbaserat filsystem skulle innebära att all information skulle kunna både sökas fram med hjälp av en sökmotor men också letas fram manuellt. Och i letandet kan man då även hitta relaterad information – något som sökmotorerna fortfarande är ganska dåliga på.

Jag förespråkar alltså att någon – Sun, Microsoft, Apple, vem som helst – genast utvecklar denna nya tidens filsystem så att vi stackars användare äntligen kan känna att vi kontrollerar all information på våra datorer. Hierarkisk datalagring är lite väl 1000-tal, faktiskt.

UPPDATERING 100322: Idag skrev idg.se om taggning. Kul!

UPPDATERING 100326: Ny artikel på IDG.se.

16 Comments