chmorph

classic Classic list List threaded Threaded
2 messages Options
Reply | Threaded
Open this post in threaded view
|

chmorph

ge-7
Hello,

I'd like to add to hunspell perl support for additional analysis tools.
There are 2 example utilities: analyze and chmorph.
analyze tool is quite understandable, it finds any good word's stem.

However, I can not understand the function of chmorph utility.
I created a sample file for Hungarian (hu.txt):
írd meg a leckéd. Nézz ide. Nézzen ide. Kapcsold ki a rezsót. Látod? Látják?
írok írsz ír írunk írtok írnak
látom látod látja.
I supply the standard Hungarian aff and dic file, and use the example:
chmorph hu.aff hu.dic hu.txt SG_2 SG_3
(convert informal Hungarian second person texts to formal third person texts)

I get this as output:
írd meg a leckéd. Nézz ide. Nézzen ide. Kapcsold ki a rezsót. Látod? Látják?
írok írsz ír írunk írtok írnak
látom látod látja.
Nothing happened, nothing is changed.all 2-nd person verbs remained 2nd person.

Did anybody use the program chmorph with success?
Where can I find any working examples for this tool?

Thanks in advance, eleonora


---------------------------------------------------------------------
To unsubscribe, e-mail: [hidden email]
For additional commands, e-mail: [hidden email]

Reply | Threaded
Open this post in threaded view
|

Re: chmorph

Németh László-2
Hello Eleonora,

Chmorph works only with 8-bit encoded morphological dictionaries. Your
example using the compatible dictionary of the Hungarian spelling and
morphological dictionary distribution "Magyar Ispell":

------------
$ echo "írd meg a leckéd. Nézz ide. Nézzen ide. Kapcsold ki a rezsót.
Látod? Látják?
írok írsz ír írunk írtok írnak
látom látod látja." | iconv -f utf-8 -t ISO8859-2 | chmorph
~/magyarispell-1.4/hu_HU_gen.{aff,dic} /dev/stdin SG_2 SG_3 | iconv -f
ISO8859-2 -t utf-8
írja meg a leckéje. Nézzen ide. Nézzen ide. Kapcsolja ki a rezsót.
Látja? Látják?

írok ír ír írunk írtok írnak

látom látja látja.
----------------

In fact, chmorph is a demonstration program. It needs more effort to
develop a useful morphological converter. For example, for the
automatic informal second person/formal third person conversion of
Hungarian texts needs a POS-tagger to disambiguate the ambiguous words
before the conversion.

Regards,
László

2009/3/22 ge <[hidden email]>:

> Hello,
>
> I'd like to add to hunspell perl support for additional analysis tools.
> There are 2 example utilities: analyze and chmorph.
> analyze tool is quite understandable, it finds any good word's stem.
>
> However, I can not understand the function of chmorph utility.
> I created a sample file for Hungarian (hu.txt):
> írd meg a leckéd. Nézz ide. Nézzen ide. Kapcsold ki a rezsót. Látod? Látják?
> írok írsz ír írunk írtok írnak
> látom látod látja.
> I supply the standard Hungarian aff and dic file, and use the example:
> chmorph hu.aff hu.dic hu.txt SG_2 SG_3
> (convert informal Hungarian second person texts to formal third person texts)
>
> I get this as output:
> írd meg a leckéd. Nézz ide. Nézzen ide. Kapcsold ki a rezsót. Látod? Látják?
> írok írsz ír írunk írtok írnak
> látom látod látja.
> Nothing happened, nothing is changed.all 2-nd person verbs remained 2nd person.
>
> Did anybody use the program chmorph with success?
> Where can I find any working examples for this tool?
>
> Thanks in advance, eleonora
>
>
> ---------------------------------------------------------------------
> To unsubscribe, e-mail: [hidden email]
> For additional commands, e-mail: [hidden email]
>
>

---------------------------------------------------------------------
To unsubscribe, e-mail: [hidden email]
For additional commands, e-mail: [hidden email]