Metadata

Synnerligen intressant om Metadata


Meta-

Meta- är ett prefix som kommer från grekiskan och betyder mellan, efter eller över. En metadiskussion är en diskussion om en diskussion, eller om formerna för den. Jämför ordningsfråga. I datasammanhang betyder meta "en underliggande definition eller beskrivning". Således är metadata en definition eller beskrivning av data – data om data. En metatext skrivs ofta efter att något man skapat, exempelvis en novell, behandlats och i denna text beskrivs utvecklingen, såväl novellens som ens egen. Metadebatt eller metadiskussion.

Open Badges

En Open Badge är ett digitalt märke som man tilldelas exempelvis för att ha utfört en uppgift eller visat en förmåga. Inom utbildningsvärlden används Open Badges både som lekfulla belöningar och som alternativ eller komplement till intyg. Ägaren kan välja att visa upp badgen på nätet exempelvis på en blogg eller profilsida. En Open Badge består av en liten digital bild i PNG-format och metadata. Metadatan är information om badgen, och den blir oftast synlig när man klickar på bilden. Den brukar omfatta. Badges och märken har funnits långt före det digitala samhället. Scoutmärken eller simmärken är exempel på icke-digitala märken som tilldelas och förvärvas för olika väl definierade bedrifter. Badges är viktiga komponenter i många TV-spel och dataspel där de används för att markera att spelaren uppnått en skicklighetsnivå och som motivation att gå vidare. I utbildningsvärlden har badges gjort sitt intåg i webbaserade kurser, till exempel distansutbildningar eller blended learning. Ofta nämns badges i samband med spelifiering eller gamification. Många badges är bara giltiga inom ett spel, en kurs eller en plattform. Däremot följer Open Badges en teknisk standard som gör dem interoperabla med andra system. De kan på sätt visas upp på andra lärplattformar, bloggverktyg eller sociala medier som har stöd för Open Badges. Standarden för Open Badges utvecklades av Mozilla, MacArthur Foundation och HASTAC. Termen Open Badge förknippas oftast med Mozillas badgesystem och infrastruktur. Idag finns dock fler plattformar och tjänster för Open Badges, och begreppet innefattar alla digitala badges som följer den öppna standarden. Badges används både som motiverande inslag och för seriös certifiering. Märken som ska fungera som alternativ till traditionella intyg behöver följa öppen standard. Exempel. En skola, kursledare eller förening som vill ta fram en badge behöver först utveckla själva märket – bilden och metadatan – och sedan lägga upp det i en badgeplattform. Det finns flera sådana tjänster på nätet och en del lärplattformar har inbyggt stöd för badges. Även för framtagning av bilden finns det tjänster där man kan kombinera olika former, färger, ikoner och textfält. Det är möjligt att ladda upp egna bilder och integrera dem i tjänstens färdiga bakgrunder. För att kunna visa upp sina märken i andra digitala medier behöver förvärvaren lägga dem i en personlig digital ryggsäck, till exempel Mozilla Backpack eller Open Badge Passport. I ryggsäcken kan ägaren sedan ordna sina märken och välja vilka som ska visas på olika ställen på nätet. Ibland kritiseras användningen av badges med motiveringen att vem som helst kan skapa badges och att kvalitetskrav saknas eller att det finns risk för en inflatorisk användning av badges. Kritikerna menar att så kallad microcredentialling, det vill säga utfärdande av badges för mycket små prestationer, sänker anseendet av badges som seriösa komplement eller alternativ till intyg. Som motargumentet kan anföras att badges är transparenta, det vill säga beskrivningen av badgens innebörd är öppet tillgänglig och nås enkelt genom ett klick på badgen. Det är upp till ägaren själv att avgöra vilka badges som är värda att visas upp i olika sammanhang. På svenska används både det engelska ordet badge och flera svenska begrepp: märke, utmärkelse, tecken. Beskrivningen av de kunskaper, färdigheter eller utförda uppgifter som krävs för att få badgen. När och i vilket sammanhang den utfärdats, till exempel inom en kurs. Information om giltighetstiden. En länk till utfärdaren, till exempel en utbildningsanordnare eller förening. Företag använder badges som intyg i utbildningar för sin personal eller sina kunder. Volontärverksamhet använder Open Badges som intyg i funktionärsutbildningar, till exempel OK-studiecentralen i Finland. Badges är digitala och optiskt tilltalande. De passar in i sociala medier, jobbsajter eller bloggar.

Data warehouse

Ett data warehouse, även kallat informationslager eller datalager, är en sammanställning av information från flera källor, utförd på ett sådant sätt att det underlättar en avancerad analys av informationen. Sammanställningen har dessutom en sådan struktur, och är försedd med sådana hjälpmedel, att analysen kan utföras utan mera djupgående IT-kunskaper. Tekniker för sökbara datalager är en del av det vidare begreppet big data, som också innefattar datautvinning, det vill säga statistisk dataanalys. Ett informationslager är i praktiken alltid databasbaserat, källorna kan dock vara lagrade på flera olika sätt, på något sätt tillgängliga för informationslagret. En mångfald sätt att överföra data finns: via epost, ftp, direkta länkar mellan databaser, med flera. Analysen av informationen är normalt baserad på flera parametrar, så kallade dimensioner. En dimension motsvaras av minst en databastabell. Det data som analyseras, faktat, lagras också det i en eller flera databastabeller. Den vanligaste uppbyggnaden av ett informationslager är stjärnschemat (engelska Star Schema), där faktatabellen (eller tabellerna) omges av en dimensionstabell per dimension. Tabellerna i ett stjärnschema är denormaliserade. Strukturen påminner om en stjärna, därav namnet. En annan vanlig uppbyggnad är snöflingeschemat (engelska Snow Flake Schema), fortfarande med en eller flera faktatabeller i mitten. Dimensionstabellerna är emellertid normaliserade, vanligtvis på tredje normalformen. Man har alltså (vanligtvis) mer än en tabell per dimension, och strukturen påminner vagt om en snöflinga. I princip är stjärnschemat mer tidskrävande att bygga än snöflingeschemat, men snabbare och enklare att använda. De flesta experter tenderar att förorda stjärnscheman. Det finns även dimensionslösa informationslager. På grund av att dessa vanligtvis är betydligt mindre effektiva vad gäller söktider, används de främst för mindre datamängder. Arbetsgången när man bygger ett informationslager brukar benämnas ETL, efter de engelska orden. En viktig del av det lagrade datat är så kallad metadata, "data om data". Metadata utgörs av information som är väsentlig för användningen av informationslagret: Laddningstidpunkt, ändringstidpunkt, beskrivning av innehållet i de olika fälten, relationer mellan olika typer av data med mera. När det gäller beskrivningen av datat är det viktigt med en enhetlig namnkonvention i de fall (allt mer vanliga) då informationslagret skall användas av dotterbolag i många länder. Det är också vanligt att olika koder (landskoder, felkoder m.m.) förklaras, ofta i olika tabeller. En typisk användning för informationslager är för att underlätta för ledningen av en stor koncern att följa affärsprocesserna. Exempelvis kan man ställa en fråga om hur mycket som sålts av vissa angivna produkter i ett antal länder under vissa år. Det erhållna svaret kan presenteras på flera olika sätt, ofta i form av ett "drillbart bildskärmsdokument" men även som exempelvis grafiska diagram och rapporter på papper. Uttrycket "drillbarhet" kommer av engelskans drill-down, där begreppet avser möjlighet att borra sig ner i materialet. Ett drillbart bildskärmsdokument är ett dokument där man kan markera olika kolumner för att antingen dela upp dem på kortare dimensionsintervall eller summera dem på större intervall. Om datan i ett sådant dokument från början presenteras per månad och land kan man exempelvis välja att summera per år eller dela upp per vecka, alternativt summera per världsdelar eller dela upp per försäljningsområden/län/kommun (motsvarande). Eftersom det är brukligt i informationslagermiljö med summeringar av data är det vanligt att spara inte bara ett, utan flera olika aggregat, alltså data som summerats på de vanligaste parametrarna, för att snabba upp sökningarna i drillbara dokument. Amerikanen Bill Inmon, som var en av de första som definierade begreppet Data warehouse, satte upp fyra krav på ett informationslager.

RAW (bildformat)

RAW är ett bildformat som består av minimalt förändrad digital information från en bildsensor hos en digital stillbildskamera, en digital filmkamera, en bildskanner eller en filmskanner. Raw betyder rå på engelska och formatet kallas därför oftast föråformat på svenska. Namnet kommer från att bildfiler i RAW-format inte är bearbetade och därför inte redo för att skrivas ut direkt eller för att redigeras i en bildbehandlare. Normalt sett bearbetas bilden av en RAW-konverterare i en intern färgrymd i kameran med bred-gamut där exakta justeringar kan göras innan konvertering till ett "positivt" filformat som TIFF, PNG eller JPEG för lagring, utskrift, eller vidare manipulation, vilket oftast kodar bilden i en enhetsberoende färgrymd. Dessa bilder beskrivs oftast som "RAW-bildfiler", trots att det egentligen inte finns ett enda RAW-filformat. Det finns ett dussintal om inte ett hundratal sådana filformat som används av olika modeller av digital utrustning (som kameror och filmskannrar). RAW-bildfiler kallas ibland för digitala negativ, i och med att de fyller samma roll som negativen vid filmfotografering. Det vill säga, negativet är inte direkt användbart som bild, men det innehåller all information som krävs för att skapa en bild. När man konverterar en RAW-bildfil till ett filformat som går att se i ett bildvisningsprogram, kallar man det därför ibland för framkallning av RAW-bilden, i likhet med att framkalla fotofilm. Detta är helt i analogi med processen som krävs vid fotoframkallning där man konverterar fotofilm till synliga utskrifter. Liksom ett filmnegativ, kan en bild i bildformatet RAW ha ett bredare dynamiskt omfång eller färg-gamut än bilden i det slutliga bildformatet, och det mesta av informationen hos den fångade bilden i RAW-format bibehålls. Syftet med bildformatet RAW är att, med minimal förlust, lagra den information som har fångats av sensorn, tillsammans med förhållanden som gällde vid fotograferingstillfället (till exempel metadata). Detta gör att man i efterhand kan göra noggrannare inställningar än om man under fotografering måste ta snabba beslut. I bildformatet JPEG måste man istället ta besluten på en gång i och med att den andra informationen kastas bort av lagringsutrymmesskäl. Alla digitala systemkameror och även vissa digitala kompaktkameror kan spara bilder i RAW-format. Normalt använder kameror ett destruktivt/förstörande komprimerande format som JPEG för att spara bilder, eftersom detta innebär att filstorleken ofta blir 80 till 90 % mindre. Priset man betalar är dock en liten kvalitetsförlust som under normala förhållanden inte är synligt för ögat. En bild sparad i RAW är dock ej komprimerad vilket kan vara användbart vid situationer i professionell fotografi där man vill undvika bildkvalitetsförlust helt. Dock använder vissa råformat förlustfri/icke-förstörande komprimering för att hålla nere filstorleken. Kameror med stöd föråformat sparar inställningar som vitbalans, färgmättnad, kontrast och skärpa, vilka antingen valts av fotografen eller bestämts automatiskt vid fotograferingen, tillsammans med bildinformationen. Råformaten är ofta tillverkarspecifika och kräver särskild programvara eller ett insticksprogram för att visa och redigera bilderna. Några bildredigeringsprogram som används för att öppna RAW-bildfiler är Gimp och Adobe Photoshop. I och med att de flesta tillverkare har olika filformat och dessutom viss skillnad mellan sina kameramodeller, måste råkonverteringsprogrammen (som finns i exempelvis Adobe Photoshop) uppdateras för varje ny kameramodell. Adobe har försökt lösa det här problemet med ett universiellt öppet format, DNG, men de stora tillverkarna som Nikon, Canon och Sony håller fortfarande fast vid sina egna format. Om man vill vara säker på att ha sina viktiga bilder läsbara för framtiden, exempelvis för sina barn, får man lagra en JPEG-kopia, eftersom man inte vet om det aktuella RAW-formatet är läsbart i framtida datasystem.

Databas

En databas (tidigare databank) är en samling information som är organiserad på ett sådant sätt att det är lätt att söka efter och hämta enskilda bitar information, samt ofta även att ändra informationen. Ordet databas kan beteckna informationen som finns lagrad, eller den programvara (databashanterare) som förstår att tolka den ofta mycket komplexa datastrukturen som lagras på hårddisken. Databaser nås via ett s.k. gränssnitt. När datorer började användas inom affärsvärlden på 1960-talet blev det viktigt att kunna spara data på ett säkert sätt. De första databaserna var hierarkiska där data lagras i en struktur anpassad till dåtidens linjära lagringsmedia som magnetband. Det är en vanlig missuppfattning att data och databaser inte fanns innan datorernas intåg. Databaser har funnits sedan mycket lång tid tillbaka. Ända sedan man började samla in data och ordna den systematiskt, exempelvis i form av arkiv och kartotek. I och med att datorerna kom fick man möjlighet att behandla data maskinellt automatisk databehandling (ADB), tidigare något missvisande kallat administrativ databehandling. I en hierarkisk databas lagras data i en trädstruktur som gör den snabb att bearbeta men svår att manipulera. En av de mest framgångsrika hierarkiska databaserna är IBM:s IMS som utvecklades för användning i Apolloprogrammet. Den moderna relationsdatabasen uppfanns av Edgar Codd 1970. En relationsdatabas består vanligtvis av en databas med flera tabeller, även kallade relationer. Informationen sparas i rader i tabellerna. Idag kan data av en mängd olika typer sparas, inte bara text och numeriska data utan också bilder, ljud och video. Idag är alla de stora DBMS/databaserna, IBM:s DB2, Oracles Oracle, Microsofts SQL Server och svenska MySQL relationsdatabaser som använder dataspråket SQL - Structured Query Language - för att definiera och söka data. Internets och World Wide Webs starka frammarsch på 1990-talet gjorde det möjligt att komma åt data i relationsdatabaser på webben via s.k. dataspråk som PHP och Sun Microsystems JSP. På 1990-talet blev objektorienterade och XML-baserade databaser tillgängliga. En populär objektdatabas är Hibernate som konverterar Java- och C-sharp-objekt så att de kan lagras i vanliga relationsdatabaser. En nygammal databastyp är den faktabaserade databasen. Idén är databasen fylls med sanna påståenden, och att man med ett frågespråk ställer frågor till dessa faktum. Arkitekturen är snarlik de tabellbaserade SQL-databaserna, men har fördelen att man enklare kan relatera många objekt till varandra utan att ha mellanliggande uppslagstabeller. Fakta lagras i form av tuplar ofta med tre eller fyra positioner, ofta identifierare, attribut, data och transaktionstidpunkt . En lovande teknik för tre-tupler, tripplar, kallas Resource Description Framework , en standard framtagen av W3C där data beskrivs som länkade nätverk av tripplar och frågas med särskilda frågespråk, bland andra SPARQL. Det amerikanska företaget Metadata Partners lanserade 2012 databasen Datomic, en distribuerad och faktabaserad transaktionsdatabas med tidsstämplar. Transaktionerna är förinställda att vara spårbara bakåt i tiden och frågor kan därigenom ställas på tidigare versioner av datat i databasen. Det går även att ställa frågor datasetet med hypotetiskt införda ändringar i datat. Frågespråket är en variant av Prolog kallad Datalog, som portats till lisp-dialekten Clojure.


Metadata