From: | Alvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org> |
---|---|
To: | Ricardo Mendoza <pgsqlcol(at)gmail(dot)com> |
Cc: | Ayuda <pgsql-es-ayuda(at)postgresql(dot)org> |
Subject: | Re: ¿Cual es el numero de palabras en la documentacion oficial? |
Date: | 2011-10-20 21:37:47 |
Message-ID: | 1319146072-sup-1578@alvh.no-ip.org |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-es-ayuda |
Excerpts from Ricardo Mendoza's message of jue oct 20 18:24:36 -0300 2011:
> Estas seguro alvaro?, palabras...?, como where, if , etc.. no letras y/o
> caracteres de forma individual, hago la aclaracion.
Palabras. Incluye "palabras" con cosas raras como signos de puntuación
(guiones, paréntesis, comas, etc), secuencias de signos, palabras
seguidas por signos, etc. Por ej. si alguien escribió "more" y después
aparece "more," eso está contado como dos palabras. Supuse que querías
un número aproximado así que no me di el trabajo de filtrar todo esto.
Sacando todo eso y dejando sólo las palabras, quedan 747669. Si quieres
saber cuántas palabras distintas se usan, son 26872.
Caracteres son cinco millones doscientos mil y fracción.
Para hacer todo esto, fui a doc/src/sgml e hice "make postgres.txt"; a
continuación usé variaciones de la siguiente receta:
fmt -w1 postgres.txt | sed -e 's/^ *//' -e 's/[^a-zA-Z]//g' | grep -v '^$' | sort -u | wc -l
El archivo en cuestión:
$ ls -l /pgsql/build/HEAD/doc/src/sgml/postgres.txt
-rw-r--r-- 1 alvherre alvherre 5725498 oct 20 13:41 /pgsql/build/HEAD/doc/src/sgml/postgres.txt
--
Álvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>
From | Date | Subject | |
---|---|---|---|
Next Message | Matias Israel Malpica Escobar | 2011-10-20 22:20:43 | Ayuda con pgpool |
Previous Message | Ricardo Mendoza | 2011-10-20 21:24:36 | Re: [pgsql-es-ayuda] ¿Cual es el numero de palabras en la documentacion oficial? |