PDA

Ver la versión completa : Macro-proyecto GP2X diccionario de japonés



LLioncurt
03/09/2005, 14:21
Bueno, he puesto este mismo hilo en elotrolado, pero supongo que aquí también habrá gente interesada:

Pues eso, que tenía pensado hacer un proyecto para GP2X que necesitaría la colaboración de cuanta más gente mejor.

La idea es hacer un traductor japonés-español-japonés, con cuantas más palabras mejor. Funcionaría con kanji, hiragana y katakana. Ya tengo bastante claro como sería todo el funcionamiento, y de empezar se empezaría después de que saliera la consola al mercado, cuando ya se tenga bastante gente para empezar. La duración del proyecto, así a ojo la calculo de 4 a 6 meses. Siguiendo la ley d Murphy de multiplicar toda estimación de tiempo por dos, no se extendería más de un año en cualquier caso. Se necesita:

- 1 ó 2 programadores. Uno de ellos necesariamente tiene que haber programado antes con GP32 y esté dispuesto a aprender a compilar con GP2X en cuanto salga. No es necesario saber nada de japonés.

- Varios grafistas, cuantos más mejor, que se encarguen en convertir a formato png, gif, o al que considere oportuno el programador los caracteres hiragana, katakana y kanji. Decir que hay trabajo para rato con esto, son 48 hiragana, 48 katakana y unos 2.000 kanji, depende de que lista utilicemos de kanji (yo haría los 2.042 que salen en el libro de kanji para recordar. El mínimo es de 1.850 kanji). Para este trabajo no se necesita ningún conocimiento de informática ni de japonés, aunque sí destreza para hacer los dibujos correctamente.

- La tira de colaboradores que se encarguen de las definiciones. Este es sin dura el núcleo del trabajo y lo que más costará, por eso cuantos más seamos antes y mejor lo haremos todo. Se dividirán en 2 grupos, japonés-español y español-japonés. Ni que decir tiene que no hace falta saber nada de informática, y japonés lo justo para poder buscar en cualquier diccionario o similar. Ya se vería luego con qué material trabajaremos.

- 1 webmaster que se encargue de hacer un foro-web. La idea es una pequeña web donde se vayan relatando todo lo que va pasando y un foro (también pequeño) con una parte pública y otra restringida a los que trabajemos en el proyecto.

- Se agradecerá la colaboración puntual de cualquiera que aporte cualquier corrección/ayuda/sugerencia.

Bueno, pues ahí está todo. Me postro con humildad ante todo aquel que quiera colaborar con el trabajo, y según se acerque la fecha de empezar ya se irán dando instrucciones. Todos los que trabajen en el proyecto, por pequeña que sea su aportación (relativamente hablando, claro) serán mencionados en el mismo programa, en el apartado de créditos. Aparte, todo lo que hagamos será de libre uso y distribución, y los derechos pertenecerán por igual a todos los trabajadores en el proyecto.

Otra cosilla es que además no tiene por qué ser un trabajo restringido a la GP2X, no creo que costase mucho compilar el proyecto para PC o PDA o cualquier otro dispositivo con capacidad suficiente.

Y por último, dar las gracias a cualquiera que ayude en el proyecto, aunque no sea integrante del equipo. Se agradecerá también cualquier tipo de publicidad en otras webs o similares.

Ciao! y que la fuerza nos acompañe.

(_=*ZaXeR*=_)
03/09/2005, 14:59
Para la Gp32 ya ahi un diccionario japones-ingles-japones

Si haceis uno, creo que ademas de que las traducciones las haga del castellano al japo y a la inversa, tambien podriais tratar de que hiciera construccion de frases, y temas gramaticales.

Sobre los caracteres, creo que debe haber por algun lado fuentes japos para la GP32 y que se podran usar para este proyecto en la GP2X

urimm
03/09/2005, 15:23
interesante... :loco: ... aunq MUY chungo. Yo me ofrezco d soporte moral, lo vais a necesitar.
PD: Digo esto xq no se hacer nada d lo q has dicho U____U

mortimor
03/09/2005, 17:09
Me gusta este proyecto, lo veo interesante por diversas razones:

Como programador lo veo como un programa no muy complejo de realzar y que ademas me permitiria utilizar y continuar mi libreria ML_Lib, que seria de mucha utilidad y permitiria dar soporte permanente al diccionario.
Me propuse aprender algo de japones, los Hiragana me los tengo mas o menos controlados y los katakana los conozco a medias ya que lo he dejado hace cosa de mes y medio por temas de trabajo. Seria una buena oportunidad para retomarlo.
Hace tiempo curse una asignatura llamada "Manejo del diccionario monolingue en castellano" (crei que era una maria de libre eleccion y acabe estudiando un tocho de 3º de hispanicas). El caso es que esta asignatura me gusto bastante ya que se profundizaba aspectos tan poco valorados como la estructura de los diccionarios, las diferentes marcas usadas y los enfoques que existen a la hora de desarrollar los diferentes tipos de diccionarios. Fue toda una experiencia (la profesora nos transmitio su entusiasmo por el tema, quede aqui un saludo para ella: "Gracias Helena"), ya entonces se me paso por la cabeza la realizacion de un programa/soporte-diccionario y ¿¿por qué no utilizar las ideas que ya tenia hace 3 años sobre su realización???


Pero... creo que el programa es el menor problema en este caso. Realizar un diccionario o plagiar uno :D:D:D puede ser una tarea titanica y requiere una revisión permanente de los datos que se agregan al proyecto. Ahora pensarlo bien... Un soporte minimo de 10000 acepciones llevaria a 10 personas, haciendo 10 acepciones al dia de lunes a domingo, mas de 3 meses y eso sin contar las tareas de revision, enlazado de datos y correcciones. Vamos que estando muy bien organizados y sin contar los inprevistos de turno... 6 meses. Luego se podria ampliar el numero de acepciones sin necesidad de tantos cuidados, ya que los enlaces serian en muchos casos sobre acepciones ya incluidas en la base inicial.

Y si se le quiere dar un uso real... debe contener frases hechas, casos de uso, familias de palabras, sinonimos y antonimos. Si esto es dificil de hacer en un diccionario monolingue... pensar en uno bilingue... no el doble de dificil, sino el triple ya que muchas de estas utilidades no son tan sencillas de copiar como simples palabras, requieren un cierto conocimiento de ambos lenguajes.

Si pensando todo esto con detenimiento seguis creyendo que se puede hacer... aqui me teneis :) Pero eso si, hasta dentro de un tiempo no estare disponible para ello.

tetsu69
03/09/2005, 17:20
Bueno, yo que llevo ya un año estudiando japones, quiero expresar mis opiniones.


El idioma japones es muy complicado a la hora de realizar un diccionario, encontramos diversos diccionarios en que las palabras se clasifican segun:

trazos del kanji
raiz del kanji
significado/familia
silaba (hiragana) que comience

etc


Teniendo en cuenta esto desde un principio, es casi imposible (amén de inutil) realizar un diccionario aceptable para la GP2X, por lo que, desde mi humilde punto de vista, me parece que este proyecto nace muerto.

bulbastre
03/09/2005, 18:56
Bueno, pues podemos elegir el tipo de búsqueda en opciones o bien hacer una sola, a ser posible la más extendida.

jjdrako
03/09/2005, 21:44
yo me ofrezco de programador ya que me parece interesante

ademas tengo un dvd de aprender japones con videos, pdfs, un programa creo tb pero aun no m lo he mirado espero hacerlo algun dia :D

PhReAk4
03/09/2005, 23:16
Creo que no es conveniente convertir cada kanji y kana a png o gif ya que es muy laborioso y ocuparia muchisima memoria. Además el diccionario existente no lo hace osea que debe tener alguna libreria implementada para poder mostrar los caracteres correctamente.

Lo suyo seria usar cualquier diccionario gratuito como wakan (creo que es tambien opensource aunque no lo se seguro).

timofonic
04/09/2005, 00:33
Sinceramente creo que andais un poco perdidos en el tema. La idea la veo muy bien, pero la GP2X tiene linux y este soporta japonés perfectamente, así que os ahorrais la pesada tarea de dibujar los kanjis/katakanas/hiraganas. Además, creo que hay diccionarios ya disponibles, así que os ahorrariais muchísimo trabajo, solo adaptar el interface gráfico a uno para la GP2X (para que sea facil de usar, ya que no incluye pantalla tactil) y mejorarlo (podríais entrar a programar en él e incluir las mejoras en la rama oficial, solo cambiando el GUI para GP2X por razones de usabilidad). Aquí hay varios programas para linux y PDAs, no los he usado así que no se aún como son:

-- Japonés --

http://nihongobenkyo.rubyforge.org
http://zaurus.biojapan.de
http://www.csse.monash.edu.au/~jwb/xjdic/
http://www.see.ed.ac.uk/~rjt/mojibake/
http://home.catv.ne.jp/pp/ginoue/software/xyaku/

Algunas herramientas de soporte japonés o desarrollo:
http://anthy.dyndns.info
http://cannadic.oucrc.org/
http://ukai.org/wiliki/wiliki.cgi?%BC%AD%BD%F1%B6%A6%C4%CC%B2%BD&l=jp

Algunas webs traductoras que pueden ser interesantes:
http://www.popjisyo.com/WebHint/Portal_e.aspx
--

-- Chino --

http://www.mandarintools.com/cedict.html
http://sourceforge.net/projects/pydict/
--
-- Coreano --

http://home.catv.ne.jp/pp/ginoue/software/xyaku/
http://ddt.mirstyle.org/gdick.html

Documentos:
http://www.papillon-dictionary.org/ConsultInformations.po?docid=3077746&docLang=eng

Utilidades:
http://www.svbug.com/administrator/packages&ports/k/ko-engdic-0.2.html
--

Por lo tanto yo creo que se puede empezar el proyecto sin ningún problema sin tener la consola, eso de esperar hasta que haya más gente no le veo ningún sentido...

Y por cierto, ya que os poneis a hacer algo como esto, no penseis solo en japonés, prepararos todo para que sea modular y sea posible añadir otros idiomas de cualquier tipo sin ningún problema...

FunkyBoy
04/09/2005, 01:03
Me parece una idea interesante....

Me estaba planteando hacer algo así para la DS, aunque la verdad es que preferiria hacerlo para GP32 o GP2X.

Varias cosas por si no os la habias planteado:

- En vez de dibujar los símbolos, sería mucho mejor usar alguna fuente escalable. Con Windows se incluyen varias en las que vienen todos los kanjis en formato truetype, pero probablemente tendría problemas legales. Recuerdo haber visto hace algún tiempo fuentes Adobe Type 1 en algun lado que eran de libre distribución (diría que en alguna página con información de como usar japones en linux). En cualquier caso se puede usar una librería llamada Freetype que maneja mogollon de formatos de fuente. De esta forma puedes ver los kanjis a cualquier tamaño sin problemas.

- Para generar el diccionario yo tiraría del EDict. Es de los más completos (si no el que más) y diría que su licencia permite usarlo sin problemas. Hace unos años en la página de Gunkan (degraciadamente desaparecida) se planteo la posibilidad de traducirlo (está en ingles) y la verdad es que no se si al final se llegó a algo. Que yo sepa no solo se incluyen las traducciones y definiciones sino que además hay clasificaciones por radicales, nivel y demás historias.

Lo que habría que hacer es currarse un buen interface que permitiera manejar la base de datos del diccionario como más nos interesase.

Si el tema tira pa'lante podeis contar conmigo para programar algo, que ya tengo ganas de terminar algún proyecto....