Tietoa sivustoportaalista


Ideana on se, että kunkin sivuston ylläpitäjä määrittelee esimerkiksi oman sivustonsa jollain hakemistolla ne tiedot, mihin luokitusryhmään sivusto kuuluu ja millä avainsanoilla sivuilta tulostetaan tekstipoimintoja. Tässä tietojen määrittelyssä käytetään hyväksi semanttisen verkon formaatteja kuten RDF tai N3.

Tuloksena oleva tietokanta voisi olla käytettävissä myös muille sovelluksille kuten esimerkiksi semanttisille hakukoneille. Tämän portaalin tietokanta tulee toimimaan kuitenkin tavallisena keskitettynä tietokantana.

Tämänhetkiset sivuston pääluokitukset ovat: Teema (yritys, kunta, blogi, jne..) ja Toimiala.

Toimialoilla on alaluokituksia ja näille luetellaan (RDF/N3-tiedostossa) sivustoilla esiintyviä toimialaa kuvaavia keskeisimpiä avainsanoja.
Sivuston ylläpitäjä voi määritellä teema/toimialaluokituksia alkuun itse ja ne lisätään ontologiaan. Myöhemmin käytetään mahdollisimman paljon hyväksi jo olemassa olevia termejä.

Portaaliin tulee näkyviin tekstipoimintoja sivustoilta toimialaluokitusten ja avainsanojen perusteella. Tekstinpoimintaohjelma huomioi taivutusmuodot.