Κυριακή, 21 Απριλίου 2013

Σήμερα στη FOSSCOMM 2013, BoF/Hackathon για την Ελληνική γλώσσα στις 15.00, αίθουσα Β3

Η FOSSCOMM μέχρι στιγμής είναι (όπως κάθε χρονιά) εξαιρετικά ενδιαφέρουσα! Γνωρίζεις από κοντά ανθρώπους που τους έχεις δει μόνο online, βάζεις πρόσωπα
δίπλα στα emails, μαθαίνεις ενδιαφέροντα πράγματα, ανταλλάζεις απόψεις ...

Ένα πράγμα που αν και τρομερά χρήσιμο, πιστεύω έλλειπε τις προηγούμενες χρονιές και ξεκίνησε φέτος από τα παιδιά στη Χαροκόπειο, είναι τα λεγόμενα BoF sessions.

Τι είναι BoF session;

Απλά, όλοι όσοι ενδιαφέρονται για ένα κοινό, συγκεκριμένο θέμα, μαζεύονται σε ένα δωμάτιο και συζητούν / λαμβάνουν αποφάσεις για να συντονίσουν τη δράση τους. Πολλές φορές αυτό μπορεί να συνδυαστεί και με λίγη συνεισφορά "επιτόπου". Η συζήτηση είναι τελείως "peer-to-peer", δεν υπάρχουν δηλαδή "συντονιστές" και "panel". Ιδανικά ένα BoF session μαζεύει λίγα άτομα (περίπου 10 είναι καλά) αλλά 100% ορεξάτους να συνεισφέρουν, ώστε να μη γίνεται χάβρα και "πηγαδάκια".

Αυτό είναι που μπορεί να κάνει τη FOSSCOMM να "βγάλει τα λεφτά της" για όσους
συμμετέχουν σοβαρά. Γιατί:
  • Ορισμένα θέματα και αποφάσεις αργούν υπερβολικά όταν γίνονται online λόγω μεγαλύτερης δυσπιστίας που υπάρχει όταν το μόνο που βλέπεις από τον άλλο είναι το email του.
  • Π.χ., ένα γρήγορο tutorial / demo μπορεί να πάρει 5-10 λεπτά ενώ για να το φτιάξεις "ασύγχρονα" ως blog post μπορεί να πάρει μια ώρα τουλάχιστον για να γίνει σωστά (screencasts, screenshots, diagrams ...)
  • Οι online συζητήσεις πολύ συχνά καταλήγουν σε flamewars για τελείως άσχετα θέματα.
Φυσικά αυτό δε σημαίνει ότι τα BoF sessions μπορούν να αντικαταστήσουν τις online
συζητήσεις, απλά δουλεύουν καλά για να "συντονίσουμε τα ρολόγια μας" και ως σημείο αναφοράς για τη μετέπειτα πολλή δουλειά που γίνεται online / ασύγχρονα.

Στα πλαίσια αυτά προσπαθώ να οργανώσω ένα BoF session + mini hackathon για την υποστήριξη της Ελληνικής γλώσσας στο ΕΛ/ΛΑΚ σήμερα στις 15.00 στην αίθουσα Β3 στη Χαροκόπειο.

Η ιδέα είναι να δούμε σε ποιο σημείο βρισκόμαστε, ποια είναι τα κύρια προβλήματα που απομένουν, να μοιραστούμε πρόσφατα αποτελέσματα μέσω σύντομων demos / tutorials και να δούμε τι σκοπεύει να κάνει καθένας από εμάς για το θέμα αυτό από εδώ κι εμπρός και πώς μπορούμε να συντονιστούμε / συνεργαστούμε για καλύτερα αποτελέσματα.

Συγκεκριμένες θεματικές περιοχές:

Ορθογραφικός έλεγχος / λεξικά hunspell

Εδώ υπάρχουν θέματα όπως το πώς θα γίνει πιο σωστά και "δημοκρατικά" το maintainance του λεξικού του hunspell από εδώ κι εμπρός (μια ενδιαφέρουσα / σχετικά εύκολη στην εφαρμογή ιδέα είναι να κάνουμε port το project "dicollecte" των Γάλλων).

Επίσης υπάρχει το θέμα του πώς μπορούμε να προσθέσουμε γραμματική πληροφορία (π.χ., "μέρος του λόγου") στο λεξικό για να μπορεί να χρησιμοποιηθεί και από το lightproof για γραμματικό έλεγχο όπως κάνουν στα Γαλλικά (grammalecte).

Παράλληλα, υπάρχουν φωνές που λένε ότι η μορφή του hunspell δεν είναι ικανοποιητική και θα πρέπει να περάσουμε σε ένα νέο framework για spellchecking βασισμένο σε WFSTs (Weighted Finite State Transducers) τα οποία μπορούν να μας δώσουν μεγαλύτερη ευελιξία, ranking κλπ κλπ

Συνώνυμα / Θησαυρός

Εδώ μπορούμε να κάνουμε σύντομα demos των wiktionary, openthesaurus και του Ελληνικού wordnet και να δούμε τι θέματα παρουσιάζονται με το interoperability
αυτών. Επίσης, μπορούμε να δούμε πώς πλέον όλοι μας μπορούμε να συνεισφέρουμε στο openthesaurus.gr χωρίς να χρειάζονται ιδιαίτερες γνώσεις.

Θέματα με τις εφαρμογές

Π.χ., στα windows στο LibreOffice υπάρχει η επιλογή όταν αλλάζεις το πληκτρολόγιο από Ελληνικά σε Αγγλικά να αλλάζει αυτόματα και η γλώσσα του κειμένου και άρα το ενεργό λεξικό ορθογραφίας, ενώ στο Linux αυτό δε δουλεύει. Μπορούμε να δούμε τι φταίει και πώς μπορεί αυτό να λυθεί.

Αντίστοιχα με τα input methods και γιατί π.χ., ορισμένες φορές δεν μπορούμε να γράψουμε τόνους σε κάποιες εφαρμογές.ι

Αναγνώριση φωνής

Γιατί δεν έχουμε αυτή τη στιγμή εφαρμογές ΕΛ/ΛΑΚ που να μπορούμε να τους μιλάμε Ελληνικά; Μπορούμε να δούμε συνοπτικά τα θέματα που υπάρχουν (π.χ., έλλειψη ανοιχτών στατιστικών μοντέλων και δεδομένων στα οποία αυτά στηρίζονται και πώς θα μπορούσαμε να το λύσουμε αυτό, γλωσσικά μοντέλα και corpora κλπ κλπ).

Αντίστοιχα για OCR, predictive input και όποια άλλη τεχνολογία σας ενδιαφέρει με μόνους περιορισμούς να αφορά την ελληνική γλώσσα και να είναι ΕΛΛΑΚ.

Mini Hackathon

Δε χρειάζεται να λύσουμε το κυπριακό ή να γράψουμε τη νέα έκδοση του duke nukem forever :P αλλά μπορούμε να παίξουμε με το Web API του openthesaurus.gr σε Android, FirefoxOS, OpenSearch, KDE, κλπ, να κάνουμε λίγο packaging για debian/ubuntu/openSUSE/Fedora κλπ όπως και libreoffice extensions (π.χ., να χωρίσουμε το libregreek.oxt σε σωστά κομμάτια και να τα κάνουμε upload, ίσως
να κάνουμε και κάποια πράγματα από το libregreek submit upstream αν δεν υπάρχει λόγος να είναι extensions). Και φυσικά ό,τι άλλο έχετε εσείς να προτείνετε :)

Με λίγη καλή θέληση και μεράκι μπορεί να είναι ένα ιδιαίτερα διασκεδαστικό και παραγωγικό "περίπου δίωρο" (15.00 - 16.45) και να μπορούμε να λέμε ότι βγήκε και κάτι από αυτή τη βόλτα :)

Τετάρτη, 26 Δεκεμβρίου 2012

Debating Microsoft comments for Greek Ministry of Education 26400 laptops program

This post hopefully completes my view on the issue of the "public advisory" for purchasing 26400 laptops for the high schools of Greece, so that I can return to my regular projects.

As I mentioned in the previous post, Microsoft also commented (in Greek) in this public advisory. Unfortunately, due to the regrettably closed process of this advisory, it was impossible to respond timely to these comments, so the only option left is to do it now, through this post and hopefully others will join the discussion as well.


Regarding Greek Ministry of education's public advisory about a school laptops program

A subject that caused quite a reaction in the Greek FOSS community lately, is the latest public advisory (in Greek) from the Ministry of Education, regarding an upcoming call for tenders for purchasing 26400 laptops for the 1760 high schools of the country.

After initial reactions in the mailing lists, some Greek FOSS organizations namely EELLAK (letter, in Greek) and GreekLUG (letter, in Greek) posted their comments, protesting mainly about the following:

Τρίτη, 30 Οκτωβρίου 2012

Google Earth 6, *buntu 12.04 και Ελληνικά

Τώρα που πρακτικά όλοι οι υπολογιστές της οικογένειας έχουν γυρίσει σε Linux (συγκεκριμένα σε μια παραλλαγή του kubuntu 12.04 που αναπτύσσουμε σιγά-σιγά) ένα από τα πράγματα που έλειπαν ήταν το Google Earth που το χρησιμοποιούμε μερικές φορές στην οικογένεια για το σχεδιασμό ορειβατικών διαδρομών κλπ.

Δυστυχώς η απλή εγκατάσταση της τελευταίας έκδοσης στο "οικογενειακό desktop" (64-bit) οδήγησε σε προβλήματα με τις ελληνικές γραμματοσειρές. Η εικόνα δηλαδή που παρουσίαζε το πρόγραμμα μετά την εγκατάσταση ήταν η ακόλουθη:



Δευτέρα, 8 Οκτωβρίου 2012

MySQL και ελληνικά

Από ότι φαίνεται όταν λέμε στη MySQL utf8 και utf8_unicode_ci, αυτό δεν είναι αρκετό για να "κάνει το σωστό" σε όλες τις περιπτώσεις. Όλα ξεκινούν από αυτό:
> select 'λαχτάρα' = 'λαχταρά' collate utf8_general_ci;
1
> select 'λαχτάρα' = 'λαχταρά' collate utf8_unicode_ci;
1

Κυριακή, 16 Σεπτεμβρίου 2012

ΕΛ/ΛΑΚ και ελληνική γλώσσα

Το συζητήσαμε στη φετινή FOSSCOMM, συζητήθηκε και στο παρασκήνιο του Java Specialists Unconference που έγινε πρόσφατα στα Χανιά. Χρειαζόμαστε περισσότερη / καλύτερη υποστήριξη της Ελληνικής γλώσσας στο ΕΛ/ΛΑΚ.

Συνήθως η απάντηση που λαμβάνω κάθε φορά που μιλάω σε κάποιον για το ζήτημα είναι "σιχαίνομαι τις μεταφράσεις". Έλα όμως που οι μεταφράσεις δεν είναι το ζήτημα!

Κυριακή, 26 Αυγούστου 2012

Trying an ubuntu-server installation under EFI/GPT using Qemu/KVM and OVMF

Recently a friend of mine was having issues installing latest Ubuntu LTS server edition on a (U)EFI/GPT-based server. So I thought, let's see if it is possible to try the installation under qemu, since I don't have any real (U)EFI hardware to test (donations welcome :P).

After a small amount of messing around I got it to work and I thought that it could be generally useful (e.g., as a first step for trying out Secure Boot technology), hence this blog post detailing my steps:

Step 1. Ingredients

  • A laptop with kubuntu 12.04 (amd64)
  • qemu-kvm 1.0
  • GNU parted
  • OVMF (I used OVMF-X64-r11337-alpha.zip binary)  (get it from sourceforge)
  • A livecd of ubuntu server 12.04 (ubuntu-12.04-server-amd64.iso)

Step 2. Preparation

First, let's make a virtual hard disk:
qemu-img create -f raw gpt.img 6G
and initialize GPT:
parted -s gpt.img mklabel gpt
Now, let's prepare OVMF:
mkdir OVMF
cd OVMF
unzip ../OVMF-X64-r11337-alpha.zip
mv OVMF.fd bios.bin
mv CirrusLogic5446.rom vgabios-cirrus.bin
cp /usr/share/qemu/{linuxboot.bin,multiboot.bin,vapic.bin} . 

Step 3. Installation

kvm -m 512 -L OVMF -vga cirrus \
  -cdrom ubuntu-12.04-server-amd64.iso \
  -hda gpt.img -boot d
We will have to wait for a while and eventually we should see the starting screen. We choose "Install Ubuntu server" and press 'e' to edit kernel command line (this is important!!). From there we need to add "pci=nocrs nomodeset" to the kernel command-line parameters. Press F10 to start the boot.

It will probably take a while until you see the installer, don't worry about this, it is normal with (U)EFI apparently ...

Then proceed to install as usual (For this experiment I just chose the defaults).

Step 4. The first boot 

Similarly, when we boot for first time we will have to go to grub boot screen and press 'e' so that we can add the 'pci=nocrs' and 'nomodeset' options once more.

After you login, remember to edit grub to make these settings permanent:
sudo sed 's/\(GRUB_CMDLINE_LINUX_DEFAULT="\)/\1pci=nocrs nomodeset/' \
 -i /etc/default/grub
sudo update-grub

Step 5. The second boot

Now you can shut down the VM and boot without the cdrom:
kvm -m 512 -L OVMF -vga cirrus -hda gpt.img -net nic -net user
If the system boots successfully, then you have succeeded this process and you may now enjoy your virtual EFI/GPT-based server :)