Há sempre quem queira fazer contas à riqueza das línguas comparando o número de palavras dicionarizadas, nem sempre com os mesmos resultados (ver aqui, aqui ou aqui, por exemplo). Mas como é que se pode fazer isso quando a noção de palavra é tão vaga e os preceitos de dicionarização diferem tanto de língua para língua e mesmo entre os dicionários de uma mesma língua?
Há dicionários em que encontramos, a par do léxico standard da língua (que já é extremamente difícil de definir, se não impossível…), «estrangeirismos», «calão», gíria profissional e termos técnicos (incluindo, designações extensas de fauna e flora), palavras arcaicas e variantes regionais. Isto pode variar de dicionário para dicionário e pode criar enormes diferenças entre o número de palavras dicionarizadas: não fiz pessoalmente esta pesquisa, mas parece que há dicionários de português que têm oito vezes mais palavras que outros...
A questão do número de entradas de um dicionário leva-nos a perguntas interessantes, mas de impossível resposta. Por exemplo: lanche é uma palavra portuguesa? Se se aceita boate e boîte, devia também estar dicionarizada a forma antiga lunch, de quando a palavra foi importada? E cassetete? E hediondo e ex æquo? E se fenilcetonúrico está num dicionário, porque não está microvilositário? Se está laringotraqueobronquite porque não está lipofuscinose? Deviam estar estas palavras todas? Se pingarelho está no dicionário, não devia também estar pixavelho ou mesmo pixavilhómetro? Se está maçarico-bique-bique, não devia também estar jágara? Se está u, como arcaísmo, porque não está ende ou despobrado? Etc., etc. Alguns dicionários aceitam variantes regionais e ou socioletais de palavras. Deve considerar-se aventesma, abantesma e abentesma, por exemplo, três palavras ou uma só? Etc., etc.
E depois há a questão da estrutura das línguas: como comparar as línguas românicas com as línguas germânicas, se, nestas últimas, se faz de dois ou mais nomes outro nome, o que é muito raro nas línguas latinas. Num dicionário dinamarquês, vandresko, tennissko, sportssko, herresko e damesko, por exemplo, são entradas distintas, como em alemão Wanderschuhe, Tennisschuhe, Sportschuhe, Herrenschue e Damenschue, embora cada um destes termos seja constituído por sko ou Schue, «sapatos» e palavras que significam «caminhar», «ténis», «desporto», «senhor» e «senhora». Num dicionário duma língua latina, estes tipos de sapato não têm, obviamente, entradas próprias. Ora há línguas com muito maiores possibilidades ainda que as línguas germânicas de aglutinar em palavras maiores outras palavras mais palavras mais pequenas...
A questão dos limites do conceito de palavra é sobremaneira interessante quando se trata de formas flexionais. Tradicionalmente, não se consideram palavras diferentes as formas flexionais (em pessoa, tempo, modo, etc.) de um verbo, nem a flexão de género e número de um nome ou adjetivo (masculino/feminino e singular/plural), quando as há; mas há dicionários que as registam, reenviando depois para a entrada no infinitivo ou na forma considerada neutra do nome ou adjetivo, o masculino singular. Também há dicionários que registam as formas ditas de «aumentativo» ou «diminutivo» de nomes e adjetivos – e quando isto é feito sistematicamente, o resultado pode ser divertido, se não parecer apenas ridículo. Evidentemente, se considerarmos as formas flexionais, uma língua como o português tem muitas palavras cujas correspondentes diretas não existem numa língua como o mandarim, em que as formas verbais não mudam (a questão é muito mais complicada, mas essa conversa não cabe agora aqui), ou o inglês, que tem três formas para um verbo regular como to form, (form, forms, formed), ao passo que o português tem 49* para um verbo regular como formar. Por outro lado, uma língua como o português, com uma flexão de caso limitada aos pronomes, tem muito menos nomes que uma língua como o finlandês, que tem flexão de caso para os nomes: se considerarmos que eu, me e mim são palavras diferentes, então o finlandês, em que há 16 casos para cada nome, tem muitas «palavras» para cada palavra: a palavra talo, «casa», tem 26 formas** entre singular e plural, como se pode ver aqui.
Por fim, embora haja outras maneiras, um pouco mais complicadas, de dividir as unidades que formam o léxico de uma língua, pensamos sempre em palavras, e vemos as palavras como uma unidade da escrita – como aparecem nos dicionários. Ora isto também é, em muitos casos, puramente convencional e a convenção seguida não é a mesma para todas as línguas, mesmo as muito próximas, ou até variantes da mesma língua. Há inclusivamente sistemas de escrita de certas línguas em que não se deixa espaço entre palavras (como acontece de facto em todas as línguas na oralidade...). Depressa, devagar, afinal, portanto, senão, etc., só são palavras por convenção ortográfica, podiam ser locuções. E as locuções de cor ou em cima só o são também por convenção, podiam ter-se tornado palavras. Evidentemente, isto não influi tanto como as questões referidas atrás no número de palavras dicionarizadas, que era a questão inicial, mas também vem à baila quando se repensa o conceito de palavra.
A (minha) conclusão é que palavra é uma palavra vaga demais para se fazer dela a medida da riqueza de uma língua. Outra conclusão é que não se deve tentar comparar o que não tem comparação. E a última é que, quando se fala de léxico (e não só...), ninguém sabe que línguas são mais ou menos ricas...
______________________
* forma, formado, formai, formais, formam, formamos, formámos, formando, formar, formara, formará, formaram, formáramos, formarão, formaras, formarás, formardes, formarei, formareis, formáreis, formarem, formaremos, formares, formaria, formariam, formaríamos, formarias, formaríeis, formarmos, formas, formasse, formásseis, formassem, formássemos, formasses, formaste, formastes, formava, formavam, formávamos, formavas, formáveis, formei, formeis, formem, formemos, formes, formo e formou
** talo, taloa, taloihin, taloiksi, taloilla, taloille, taloilta, taloin, taloina, taloine, taloissa, taloista, taloitta, taloja, talojen, taloksi , talolla, talolle, talolta, talon, talona, taloon , talossa, talosta, talot, talotta