Re: ¿Cual es el numero de palabras en la documentacion oficial?

From: Alvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>
To: Ricardo Mendoza <pgsqlcol(at)gmail(dot)com>
Cc: Ayuda <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: Re: ¿Cual es el numero de palabras en la documentacion oficial?
Date: 2011-10-20 21:37:47
Message-ID: 1319146072-sup-1578@alvh.no-ip.org
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda


Excerpts from Ricardo Mendoza's message of jue oct 20 18:24:36 -0300 2011:
> Estas seguro alvaro?, palabras...?, como where, if , etc.. no letras y/o
> caracteres de forma individual, hago la aclaracion.

Palabras. Incluye "palabras" con cosas raras como signos de puntuación
(guiones, paréntesis, comas, etc), secuencias de signos, palabras
seguidas por signos, etc. Por ej. si alguien escribió "more" y después
aparece "more," eso está contado como dos palabras. Supuse que querías
un número aproximado así que no me di el trabajo de filtrar todo esto.

Sacando todo eso y dejando sólo las palabras, quedan 747669. Si quieres
saber cuántas palabras distintas se usan, son 26872.

Caracteres son cinco millones doscientos mil y fracción.

Para hacer todo esto, fui a doc/src/sgml e hice "make postgres.txt"; a
continuación usé variaciones de la siguiente receta:

fmt -w1 postgres.txt | sed -e 's/^ *//' -e 's/[^a-zA-Z]//g' | grep -v '^$' | sort -u | wc -l

El archivo en cuestión:

$ ls -l /pgsql/build/HEAD/doc/src/sgml/postgres.txt
-rw-r--r-- 1 alvherre alvherre 5725498 oct 20 13:41 /pgsql/build/HEAD/doc/src/sgml/postgres.txt

--
Álvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Matias Israel Malpica Escobar 2011-10-20 22:20:43 Ayuda con pgpool
Previous Message Ricardo Mendoza 2011-10-20 21:24:36 Re: [pgsql-es-ayuda] ¿Cual es el numero de palabras en la documentacion oficial?