edición digital para la biblioteca digital del ilce...

2

Edición Digital para la Biblioteca Digital del ILCE

Título original: Lectures on Elementary Mathematics

© De la traducción: Emilio Méndez Pinto

Primera edición: The Open Court Publishing Company, 1898

D. R. © The Open Court Publishing Company, 1898

ISBN: 978-0-486-46281-3

Prohibida su reproducción por cualquier medio mecánico o

eléctrico sin la autorización por escrito de los coeditores.

3

LECCIÓN I

SOBRE LA ARITMÉTICA, Y EN PARTICULAR FRACCIONES

Y LOGARITMOS

La aritmética se divide en dos partes. La primera se basa en el sistema decimal de

notación, y en la manera de arreglar los caracteres numerales para que expresen

números. Esta primera parte comprende a las cuatro operaciones ordinarias de adición,

sustracción, multiplicación, y división, operaciones que, como es sabido, serían

diferentes si un sistema distinto fuese adoptado, pero no sería difícil transformar desde

un sistema a otro, si un cambio de sistemas fuera deseable.

La segunda parte es independiente del sistema de numeración. Se basa en la

consideración de cantidades y en las propiedades generales de los números. La teoría de

las fracciones, la teoría de las potencias y las raíces, la teoría de las progresiones

aritmética y geométrica, y, por último, la teoría de los logaritmos, están incluidas en

esta parte. Me propongo avanzar, aquí, con algunas observaciones y comentarios sobre

las diferentes ramas de esta parte de la aritmética, que se podría considerar como la

aritmética universal, al tener una íntima afinidad con el álgebra. Esto es porque, si en

lugar de particularizar las cantidades consideradas, y en lugar de asignarlas

numéricamente, las tratamos de un modo más bien general, designándolas con letras,

tenemos álgebra en vez de aritmética.

Ustedes saben lo que es una fracción. La noción de una fracción es ligeramente

más compuesta que la de los números enteros. En estos últimos, consideramos

solamente una cantidad repetida. Para llegar a la noción de una fracción, es necesario

considerar la cantidad dividida en un cierto número de partes. Las fracciones

representan, casi siempre, razones*, y sirven para expresar una cantidad por medio de

otra. En general, nada mensurable puede ser medido excepto por fracciones que

expresen el resultado de la medición, a menos que la medida sea contenida un número

exacto de veces en la cosa a ser medida.

* Lagrange utiliza la palabra francesa que en español significa razones para referirse a las proporciones que las fracciones representan. Llega, paulatinamente, a la noción de proporción más adelante. En español, es mucho más común la palabra proporciones que razones para referirse a esta parte de la aritmética. Sin embargo, hago la misma distinción que hace Lagrange, para permanecer fiel al texto y al sentido originales del autor. Nota del Traductor.

4

Ustedes también saben cómo una fracción puede ser reducida a sus términos más

bajos. Cuando el numerador y el denominador son - ambos - divisibles por el mismo

número, se puede encontrar su máximo común divisor a partir de un ingenioso método

que le debemos a EUCLIDES. Este método es sumamente simple y lúcido, pero puede

volverse aún más evidente a los ojos debido a la siguiente consideración. Supongamos,

por ejemplo, que nos ha sido dada una longitud, y que queremos medirla. Las unidades

para medir también nos son dadas, y queremos saber cuántas veces están éstas

contenidas en la longitud. Lo primero que se debe hacer, es agotar la unidad de medida,

tantas veces como se pueda, en la longitud dada, y eso dará un cierto número entero de

medidas. Si no queda ningún resto, la operación está terminada. Pero si sí hay un resto,

éste debe ser todavía evaluado. Si la medida es dividida en partes iguales, por ejemplo,

en diez, doce, o en más partes iguales, el procedimiento natural es usar una de estas

partes como una nueva medida y observar cuántas veces está contenida en el resto.

Tendremos entonces, para el valor de nuestro resto, una fracción cuyo numerador es el

número de partes contenida en el resto, y el denominador el número total de partes en

las cuales está dividida la medida dada. Supongamos, ahora, que nuestra medida no está

dividida así, y que aún queremos determinar la razón de la longitud propuesta a la

longitud que hemos adoptado como nuestra medida. Hablaré entonces del

procedimiento que surge de manera más natural para realizar esto.

Si tenemos un resto, como es menor que la medida, tendremos naturalmente que

buscar cuántas veces está contenido nuestro resto en la medida. Digamos que dos veces,

y que todavía queda un resto. Pongamos, entonces, este resto en el resto precedente.

Como necesariamente es más pequeño, estará contenido un cierto número de veces en el

resto precedente, digamos tres veces, y entonces puede que hay otro resto, o puede que

no; y seguimos procediendo así. En estos diferentes restos tendremos lo que se llama

una fracción continua. Por ejemplo, hemos encontrado que la medida está contenida

tres veces en la longitud propuesta. Tenemos, para empezar, el número tres. Y hemos

encontrado que el primer resto se encuentra dos veces en la medida. Tendremos

entonces la fracción uno dividido entre dos. Pero este último denominador no está

completo, porque se supone que todavía queda un resto. Este resto producirá otra

fracción similar, que debe ser añadida al último denominador, y que debe ser, a partir de

nuestra suposición, uno dividido entre tres. Y así hacemos con el resto. Tendremos, de

esta forma, la fracción

5

3 + 1

2 + 1

3 +…

como la expresión de la razón entre la longitud propuesta y la medida adoptada.

Las fracciones que tienen esta forma son llamadas fracciones continuas, y

pueden ser reducidas a fracciones ordinarias a partir de las reglas comunes. Así, si nos

detenemos en la primera fracción, es decir, si consideramos solamente al primer resto y

abandonamos el segundo, tendremos 2

13+ , que es igual a

2

7. Si consideramos

únicamente al primer y al segundo restos, nos detenemos en la segunda fracción, y

entonces tenemos .

3

12

13

++ Y .

3

7

3

12 =+ Tendremos, por lo tanto,

7

33+ , que es igual

a 7

24. Y así sucesivamente con el resto. Si llegamos, en el transcurso de nuestra

operación, a un resto que está contenido de manera exacta en el resto precedente, la

operación está terminada, y tendremos, en la fracción continua, una fracción común que

es el valor exacto de la longitud a ser medida, en términos de la longitud que sirvió

como nuestra medida. Si a partir de esto, la operación no está terminada, puede ser

continuada hasta el infinito, y entonces tendremos fracciones que se aproximarán cada

vez más y más al valor verdadero.

Si comparamos ahora este procedimiento con el empleado para encontrar el

máximo común divisor de dos números, veremos que es, virtualmente, la misma cosa;

la diferencia es que, al encontrar el máximo común divisor, dirigimos nuestra atención

solamente a los diferentes restos, de los cuales el último es el divisor buscado, mientras

que al emplear los cocientes sucesivos, como hicimos arriba, obtenemos fracciones que

se aproximan - de manera constante - cada vez más y más a la fracción formada por los

dos números dados, y de los cuales el último es la fracción en sí misma reducida a sus

términos más bajos.

Debido a que la teoría de las fracciones continuas es poco conocida, pero, no

obstante, es de gran utilidad en la solución de importantes cuestiones numéricas,

hablaremos más plenamente de la formación y propiedades de estas fracciones. Primero,

supongamos que los cocientes encontrados, ya sea por la operación mecánica, o por el

6

método de encontrar el máximo común divisor, son, como arriba, 3, 2, 3, 5, 7, 3. La

siguiente es una regla por medio de la cual podemos registrar, de una sola vez, las

fracciones convergentes que resultan de estos cocientes, sin tener que desarrollar

fracción continua alguna.

El primer cociente, suponiendo que está dividido entre la unidad, nos dará la

primera fracción, que será demasiado pequeña, a saber, .1

3 Después, al multiplicar el

numerador y el denominador de esta facción por el segundo cociente, y al añadir la

unidad al numerador, obtendremos la segunda fracción, ,2

7 que será muy grande. Al

multiplicar, de la misma manera, el numerador y el denominador de esta fracción por el

tercer cociente, y al añadir al numerador el numerador de la fracción precedente, y al

denominador el denominador de la fracción precedente, obtendremos nuestra tercera

fracción, que será demasiado pequeña. Así, si el tercer cociente es 3, tenemos para

nuestro numerador ( ) ,2432137 =+=× y para nuestro denominador ( ) .71632 =+=×

El tercer convergente, por lo tanto, es .7

24 Procedemos de la misma forma para el

cuarto convergente. Si el cuarto cociente es 5, decimos que 24 veces 5 es 120, y esto

más 7, que es el numerador de la fracción precedente, es 127; similarmente, 7 veces 5 es

35, y esto más 2 es 37. La nueva fracción, por lo tanto, es .37

127 Y así con el resto.

De esta forma, al emplear los seis cocientes 3, 2, 3, 5, 7, 3, obtenemos las seis

fracciones ,835

2866,

266

913,

37

127,

7

24,

2

7,

1

3de las cuales la última, suponiendo que la

operación debe ser completada en el sexto cociente 3, será el valor requerido de la

longitud medida, o la fracción en sí misma reducida a sus términos más bajos.

Las fracciones que precedieron a lo último son alternativamente más pequeñas y

más grandes que la última, y tienen la ventaja de aproximarse cada vez más y más a su

valor de manera tal que ninguna otra fracción puede aproximarse más cerca, excepto si

su denominador es más grande que el producto del denominador de la fracción en

cuestión y el denominador de la siguiente fracción. Por ejemplo, la fracción 7

24 es

menor que el valor verdadero de la fracción 835

2866, pero se acerca a éste de manera más

cercana de lo que lo hace cualquier otra fracción cuyo denominador no sea mayor que el

7

producto de 7 por 37, esto es, 259. Así, cualquier fracción expresada en números

grandes puede ser reducida a una serie de fracciones expresadas en números pequeños y

que se acerque lo más posible a ella en valor.

La demostración de las propiedades precedentes se deduce de la naturaleza

misma de las fracciones continuas, y del hecho de que, si buscamos la diferencia entre

una de las fracciones convergentes y la siguiente adyacente a ésta, obtendremos una

fracción de la cual el numerador será siempre la unidad y el denominador el producto de

los dos denominadores; una consecuencia que se sigue, a priori, de la misma ley de la

formación de estas fracciones. Así, la diferencia entre 2

7 y

1

3 es

2

1, en exceso; entre

7

24 y

2

7,

14

1, en defecto; entre

37

127 y

7

24,

259

1, en exceso, etc. El resultado es que, al

emplear esta serie de diferencias, podemos expresar, en una forma distinta y muy

simple, las fracciones que nos ocupan aquí, por medio de una segunda serie de

fracciones de las cuales los numeradores son todos unidad y los denominadores,

sucesivamente, los productos de cada dos denominadores adyacentes. En lugar de las

fracciones escritas arriba, tenemos entonces la serie:

.835266

1

26637

1

377

1

72

1

21

1

1

3

×+

×−

×+

×−

×+

El primer término, como podemos ver, es la primera fracción, el primero y el

segundo, juntos, dan la segunda fracción 2

7, el primero, el segundo, y el tercero, dan la

tercera fracción, 7

24, y así sucesivamente con el resto; el resultado es que la serie entera

es equivalente a la última fracción.

Existe todavía otra forma, menos conocida pero en algunos aspectos más simple,

de tratar con la misma cuestión, y que nos conduce directamente a una serie similar a la

precedente. Volviendo al ejemplo anterior, después de haber encontrado que la medida

entra tres veces en la longitud a ser medida, y que, después de que el primer resto ha

sido aplicado a la medida, hay aún un nuevo resto, en lugar de comparar este segundo

resto con el precedente, como hicimos arriba, podemos compararlo con la medida en sí

misma. Así, suponiendo que entra en esta última siete veces con un resto, comparamos

de nuevo este último resto con la medida, y así sucesivamente, hasta que lleguemos, si

es posible, a un resto que sea una parte alícuota de la medida, lo que hará que la

operación termine. Si, por el contrario, la medida y la longitud a ser medida son

8

inconmensurables, el proceso puede continuar hasta el infinito. Tenemos entonces,

como expresión de la longitud medida, la serie ...72

1

2

13 +

×−+ .

Es evidente que este método es también aplicable a las fracciones ordinarias.

Constantemente conservamos al denominador de la fracción como el dividendo, y

tomamos a los diferentes restos, de manera sucesiva, como divisores. Así, la fracción

835

2866 da los cocientes 3, 2, 7, 18, 19, 46, 119, 417, 835; de los cuales obtenemos la

serie ...;191872

1

1872

1

72

1

2

13 +

×××−

××+

×−+ y como estas fracciones parciales

disminuyen rápidamente, tendremos, al combinarlas sucesivamente, las fracciones

simples ,...,1872

865,

72

48,

2

7

××× que constantemente se acercarán, cada vez más y más, al

valor verdadero buscado, y el error será menor que con las primeras de las fracciones

parciales abandonadas.

Nuestras observaciones hechas sobre los métodos precedentes no deben

interpretarse como significando que el empleo de fracciones decimales no es siempre

preferible para expresar los valores de fracciones para cualquier grado de exactitud que

deseemos. Pero existen casos en donde es necesario que estos valores sean expresados

por la menor cantidad posible de figuras. Por ejemplo, si fuese requerido construir un

planetario, debido a que las razones de las revoluciones de los planetas de uno al otro

son expresadas por números muy grandes, sería necesario, para no multiplicar de

manera excesiva el número de dientes sobre las ruedas, aprovechar a los números

pequeños, pero, al mismo tiempo, seleccionarlos de tal forma que sus razones se

aproximen lo más posible a las razones reales. Fue, de hecho, esta cuestión la que

sugirió a HUYGENS, en su búsqueda por esta solución, el empleo de las fracciones

continuas, y de esta forma nació la teoría de estas fracciones. Tiempo después, durante

la elaboración de esta teoría, se encontró que era apta para la solución de otras

cuestiones importantes, y esta es la razón, debido a que no se encuentra en trabajos

elementales, por la que sentí necesario entrar en detalles al exponer sus principios.

Pasemos ahora a la teoría de las potencias, proporciones, y progresiones. Como

ustedes ya saben, un número multiplicado por sí mismo produce su cuadrado, y

multiplicado de nuevo por sí mismo produce su cubo, etc. En la geometría, no vamos

más allá del cubo, porque ningún cuerpo puede tener más de tres dimensiones. Pero en

9

el álgebra y en la aritmética, vamos tan lejos como queramos. Y es aquí en donde la

teoría de la extracción de raíces tiene su origen. Porque, aunque cada número puede ser

elevado a su cuadrado y a su cubo y así sucesivamente, no es verdad que,

recíprocamente, cada número sea un cuadrado exacto o un cubo exacto. El número 2,

por ejemplo, no es un cuadrado; y esto es porque el cuadrado de 1 es 1, y el cuadrado de

2 es cuatro, y como no hay otros números enteros entre estos dos, es imposible

encontrar un número entero que, multiplicado por sí mismo, dé 2. No puede tampoco

ser encontrado en las fracciones, porque si tomamos una fracción reducida a sus

términos más bajos, el cuadrado de esa fracción será de nuevo una fracción reducida a

sus términos más bajos, y, consecuentemente, no puede ser igual al número entero 2.

Pero aunque no podamos obtener la raíz cuadrada de 2 de manera exacta, sí nos

podemos acercar a ella tanto como queramos, particularmente por las fracciones

decimales. Al seguir las reglas comunes para la extracción de raíces cuadradas, raíces

cúbicas, etc., el proceso puede ser extendido al infinito, y nos podemos acercar a los

valores verdaderos de las raíces con cualquier grado de exactitud que queramos.

Pero no entraré en detalles aquí. La teoría de las potencias ha dado lugar a la de

las progresiones, y antes de entrar en ésta, son necesarias unas palabras respecto a las

proporciones.

Cada fracción expresa una razón. Si tenemos dos fracciones iguales hay, por lo

tanto, dos razones iguales; y los números que constituyen las fracciones o las razones

forman lo que se llama una proporción. De esta forma, la igualdad de los radios 2 a 4 y

3 a 6 produce la proporción 2 : 4 : : 3 : 6, porque 4 es el doble de 2 como 6 es el doble

de 3. Muchas de las reglas de la aritmética dependen de la teoría de las proporciones. En

primer lugar, es la base de la célebre regla de tres, cuyo uso es tan extensivo. Ustedes

saben que cuando los tres primeros términos de una proporción están dados, para

obtener el cuarto tenemos simplemente que multiplicar los últimos dos conjuntamente y

dividir el producto entre el primero. Se han concebido, de igual manera, varias reglas

especiales, y éstas han encontrado lugar en los libros sobre aritmética; pero todas ellas

son también reducibles a la regla de tres, e incluso pueden ser obviadas si

comprendemos a fondo las condiciones del problema. Existen reglas de tres directas,

inversas, simples, compuestas, reglas de asociación, de mezclas, etc. En todos los casos,

únicamente es necesario considerar cuidadosamente las condiciones del problema, y

acomodar correspondientemente los términos de la proporción.

10

No entraré en más detalles sobre este tema. Existe, sin embargo, otra teoría que

es útil en numerosas ocasiones, a saber, la teoría de las progresiones. Cuando se tienen

varios números que guardan la misma proporción uno con otro, y que se siguen de tal

forma que el segundo es al primero lo que el tercero al segundo, como el cuarto es al

tercero, etc., se dice que estos números forman una progresión. Empezaré con una

observación.

Los libros sobre aritmética y álgebra comúnmente suelen hacer la distinción

entre dos tipos de progresión, la aritmética y la geométrica, correspondientes a las

proporciones llamadas aritmética y geométrica. Pero la denominación de proporción me

parece extremadamente inapropiada si se aplica a la proporción aritmética. Y como es

uno de los objetivos de la École Normale† rectificar el lenguaje científico, la presente

digresión no es irrelevante.

Puedo entender, entonces, que la idea sobre la proporción está bien establecida

por el uso, y que corresponde solamente a lo que se conoce como proporción

geométrica. Cuando hablamos de la proporción de las partes del cuerpo de un hombre,

de la proporción de las partes de un edificio, cuando decimos que un plano debe ser

reducido proporcionalmente en tamaño, etc., en general, cuando decimos que una cosa

es proporcional a otra, entendemos por proporción únicamente la igualdad de las

razones, como en la proporción geométrica, y nunca igualdad de diferencias, como en la

proporción aritmética. Por lo tanto, en lugar de decir que los números 3, 5, 7, 9, están en

proporción aritmética, debido a que la diferencia entre 5 y 3 es la misma que entre 9 y 7,

estimo que es deseable que se emplee otro término, a fin de evitar cualquier

ambigüedad. Podemos llamar, por ejemplo, a tales números equi-diferentes, reservando

de esta manera el nombre de proporcionales para los números que están en proporción

geométrica, como 2, 4, 6, 8, etc.

En cuanto al resto, no puedo entender por qué la proporción llamada aritmética

es más aritmética que la que es llamada geométrica, ni por qué esta última es más

geométrica que la primera. Por el contrario, la idea primitiva de la proporción

geométrica está basada en la aritmética, porque la noción de razones surge,

esencialmente, de la consideración de los números. Aún así, mientras espero que esta

designación inapropiada sea cambiada, continuaré utilizando estos términos, debido a

cuestiones de simplicidad y conveniencia.

† La École Normale es la Escuela Normal Superior de Francia, lugar donde Lagrange dictó estas lecciones. Nota del Traductor.

11

La teoría de las progresiones aritméticas presenta algunas pocas dificultades. Las

progresiones aritméticas consisten en cantidades que se incrementan o que disminuyen,

de manera constante, por la misma cuantía. Pero la teoría de las progresiones

geométricas es más difícil y más importante, debido a que un gran número de cuestiones

interesantes dependen de ella, por ejemplo, todos los problemas del interés compuesto,

todos los problemas que se relacionan con el descuento, y muchos otros de la misma

naturaleza.

En general, las cantidades en la proporción geométrica se producen cuando una

cantidad se incrementa y la fuerza que genera este incremento, para decirlo de alguna

manera, es proporcional a esa cantidad. Se ha observado que en los países en donde los

medios para subsistir son fácilmente adquiridos, como en las primeras colonias

americanas, la población se duplica al cabo de veinte años; si es el doble al final de

veinte años, será el cuádruple al final de cuarenta, óctuple al final de sesenta, etc., y el

resultado es, como vemos, una progresión geométrica, correspondiente a intervalos de

tiempo en la progresión aritmética.‡ Sucede algo parecido con el interés compuesto. Si

una suma dada de dinero produce, a lo largo de un determinado tiempo, una cierta suma,

al final del doble del tiempo, la suma original habrá producido una suma adicional

equivalente, y después, la suma producida en el primer espacio de tiempo habrá

producido durante el segundo espacio de tiempo - de igual manera y en su proporción -

una cierta suma; y así con el resto. La suma original es comúnmente llamada la

principal, la suma producida el interés, y la razón constante de la principal al interés por

año, la tasa. Así, la tasa veinte significa que el interés es la veinteava parte del principal

(una tasa que es comúnmente llamada 5 por ciento, al ser 5 la veinteava parte de 100).

Sobre esta base, la suma principal, al final de un año, se habrá incrementado por su

vigésima parte; consecuentemente, habrá aumentado en la razón de 21 a 20. Al final de

dos años, se habrá incrementado de nuevo en la misma razón, esto es, en la razón de 20

21

multiplicada por 20

21; al final de tres años, en la razón de

20

21multiplicada dos veces por

sí misma, etc. De esta manera, podemos encontrar que al final de quince años, la suma

se habrá casi duplicado, y que al final de cincuenta y tres años se habrá incrementado

diez veces. De manera inversa, debido a que una suma pagada ahora será el doble al

‡ Resulta sumamente interesante constatar cómo el gran genio de Lagrange anticipa algunos de los principios que más tarde serán expuestos, en mayor detalle y con otros medios y fines, por Malthus en sus escritos sobre la población. Nota del Traductor.

12

final de quince años, es claro que una suma que no se paga hasta después de la

expiración de quince años, tiene ahora el valor de un medio de su cantidad. Esto es lo

que se denomina como el valor presente de una suma pagadera al final de un cierto

tiempo; y es evidente que, para encontrar su valor, solamente es necesario dividir la

suma prometida entre la fracción 20

21, o multiplicarla por la fracción

21

20, tantas veces

como existan años para ejecutar. De esta forma podemos ver que una suma pagadera al

final de cincuenta y tres años, vale en el presente solamente una décima parte. De esto

se sigue que se obtienen pocas ventajas de entregar la absoluta propiedad de una suma

de dinero para disfrutarla sólo por un periodo de, digamos, cincuenta y tres años; y esto

es porque por tal transacción ganamos solamente una décima parte en uso real, mientras

que perdemos la posesión de la propiedad para siempre.

En las anualidades, la consideración del interés se combina con el de la

probabilidad de la vida; y como cada uno es propenso a creer que va a vivir mucho

tiempo, y como, por otra parte, uno tiende a subestimar el valor de la propiedad que se

abandona al morir, surge la peculiar tentación - siempre y cuando no se tengan hijos - de

invertir la fortuna de uno, en su totalidad o en partes, en anualidades. Sin embargo,

cuando se ponen a prueba de un cálculo riguroso, las anualidades no ofrecen las

suficientes ventajas como para inducir a las personas a que sacrifiquen por ellas la

propiedad del capital original. De acuerdo con esto, siempre que se ha intentado crear

anualidades lo suficientemente atractivas como para inducir a los individuos a creer en

ellas, ha sido necesario ofrecerlas en términos que resultan onerosos o pesados para la

compañía. Pero diremos más sobre este tema cuando expongamos la teoría de las

anualidades, que es una rama del cálculo de probabilidades.

Concluiré la presente lección con unas palabras sobre los logaritmos. La idea

más simple que podemos formarnos sobre la teoría de los logaritmos, tal como se

encuentran en las tablas ordinarias, es la de concebir todos los números como potencias

de 10; los exponentes de estas potencias, por lo tanto, serán los logaritmos de los

números. De esto resulta evidente que la multiplicación y división de dos números es

reducible a la adición y sustracción de sus respectivos exponentes, esto es, de sus

logaritmos. Y, consecuentemente, la involución y la extracción de las raíces son

reducibles a la multiplicación y división, lo que representa una inmensa ventaja en la

aritmética y hace que los logaritmos tengan un incalculable valor en esa ciencia.

13

Pero en el periodo en el que los logaritmos fueron inventados, los matemáticos

no estaban en posesión de la teoría de las potencias. No sabían que la raíz de un número

pudiera ser representada por una potencia fraccionaria. Lo siguiente será una exposición

sobre cómo se acercaron al problema.

La idea primitiva era la de dos progresiones correspondientes, una aritmética, y

la otra geométrica. De esta forma, se alcanzó la noción general de un logaritmo. Pero

todavía faltaban los medios para encontrar los logaritmos de todos los números. Como

los números se siguen uno a otro en la progresión aritmética, era necesario, para que

pudieran ser encontrados entre los términos de la progresión geométrica - para

establecer aquella progresión - que sus sucesivos términos difieran el uno del otro por

cantidades extremadamente pequeñas; y, para probar la posibilidad de expresar todos

los números en esta forma, NAPIER, su inventor, los consideró primero como

expresados por líneas y por partes de líneas, y estas líneas las consideró como generadas

por el movimiento continuo de un punto, lo que era muy natural.

De acuerdo con esto, consideró dos líneas, la primera generada por el

movimiento de un punto describiendo en tiempos iguales espacios en progresión

geométrica, y la segunda generada por un punto que describía espacios que

incrementaban mientras el tiempo lo hacía, y que consecuentemente formaban una

progresión aritmética correspondiente a la progresión geométrica. Y supuso, en aras de

la simplicidad, que las velocidades iniciales de estos dos puntos eran iguales. Esto le dio

los logaritmos, primero llamados naturales, y después hiperbólicos, cuando se

descubrió que podían ser expresados como partes del área incluida entre una hipérbola y

sus asíntotas. Por este método, es evidente que para encontrar el logaritmo de cualquier

número dado, únicamente es necesario tomar una parte en la primera línea igual al

número dado, y buscar la parte en la segunda línea que haya sido descrita en el mismo

intervalo de tiempo que la parte en la primera.

Conforme a esta idea, si tomamos como los dos primeros términos de nuestra

progresión geométrica los números con las muy pequeñas diferencias 1 y 1.0000001, y

como aquellos de nuestra progresión aritmética a 0 y 0.0000001, y si buscamos de

manera sucesiva - por las reglas conocidas - todos los términos siguientes de las dos

progresiones, encontraremos que el número 2 - expresado aproximadamente al octavo

lugar de los decimales - es el término 6931472 de la progresión geométrica, esto es, que

el logaritmo de 2 es 0.6931472. El número 10 es el término 23025851 de la misma

progresión; por lo tanto, el logaritmo de 10 es 2.3025851, y así con el resto. Pero

14

NAPIER, teniendo que determinar solamente los logaritmos de números menores que la

unidad para los propósitos de la trigonometría, donde los senos y los cosenos de los

ángulos son expresados como fracciones del radio, consideró una progresión geométrica

decreciente, de la cual los primeros dos términos eran 1 y 0.9999999; y, a partir de esta

progresión, determinó los términos sucesivos con computaciones enormes. En esta

última hipótesis, el logaritmo que hemos encontrado para 2 se convierte en el número

2

1 ó 0.5, y el del número 10 se convierte en el número

10

1 ó 0.1; como es evidente dada

la naturaleza de las dos progresiones.

El trabajo de NAPIER apareció en 1614, y su utilidad se percibió de inmediato.

Pero también se percibió de inmediato que se ajustaría mejor al sistema decimal de

nuestra aritmética, y que por lo tanto sería más simple, si el logaritmo de 10 fuese hecho

unidad, conforme a lo cual el de 100 fuese 2, y así con el resto. Para lograr ese fin, en

lugar de tomar como los primeros dos términos de nuestra progresión geométrica a los

números 1 y 0.0000001, debemos tomar los números 1 y 1.0000002302, manteniendo a

0 y 0.0000001 como los términos correspondientes de la progresión aritmética. Por

consiguiente, se verá que, mientras que el punto que está supuesto para generar - debido

a su movimiento - la línea geométrica, o los números, está describiendo la sumamente

pequeña porción de 0.0000002302…, el otro punto - que tiene la tarea de generar

simultáneamente la línea aritmética - habrá descrito la porción 0.0000001; y que, por lo

tanto, los espacios descritos en el mismo tiempo por los dos puntos al principio de su

movimiento, es decir, sus velocidades iniciales, en lugar de ser iguales (como en el

sistema precedente), serán en la proporción de los números 2.302… a 1, donde debe

observarse que el número 2.302… es exactamente el número que en el sistema original

de los logaritmos naturales representaba el logaritmo de 10 - un resultado demostrable a

priori , como veremos cuando apliquemos las fórmulas del álgebra a la teoría de los

logaritmos. BRIGGS, un contemporáneo de NAPIER, es el autor de este cambio en el

sistema de logaritmos, y también lo es de las tablas de logaritmos que se usan

comúnmente. Una porción de éstas fue calculada por BRIGGS, y la otra por VLACQ,

en Holanda.

Estas tablas aparecieron en Gouda, en 1628. Ellas contienen los logaritmos de

todos los números del 1 al 100000 para diez lugares decimales, y son, hoy en día,

sumamente raras. Pero después se descubrió que, para propósitos ordinarios, siete

decimales eran suficientes, y los logaritmos se encuentran en esta forma en las tablas

15

que se utilizan hoy en día. BRIGGS y VLACQ emplearon un número de artificios

sumamente ingeniosos para facilitar su trabajo. El recurso que se ofreció de manera más

natural y que es también uno de los más simples, consiste en tomar los números 1, 10,

100,…, de los cuales los logaritmos son 0, 1, 2,…, e interpolar, entre los términos

sucesivos de estas dos series, tantos términos correspondientes como queramos, en la

primera serie por medios proporcionales geométricos, y en la segunda por medios

aritméticos. De esta manera, cuando hemos llegado a un término en la primera serie que

se aproxima al octavo lugar decimal - el número cuyo logaritmo buscamos -, el término

correspondiente de la otra serie será, aproximadamente para el octavo lugar decimal, el

logaritmo de ese número. Así, para obtener el logaritmo de 2, como 2 yace entre 1 y 10,

buscamos primero, por la extracción de la raíz cuadrada de 10, la media geométrica

entre 1 y 10, que es 3.16227766, mientras que la correspondiente media aritmética entre

0 y 1 es 2

1 ó 0.50000000; de esta forma, estamos seguros que este último número es el

logaritmo del primero. De nuevo, como 2 yace entre 1 y 3.16227766, el número que

acabamos de encontrar, buscamos de la misma manera la media geométrica entre estos

dos números, y encontramos que es el número 1.77827941. Como antes, tomando la

media aritmética entre 0 y 0.50000000, tendremos para el logaritmo de 1.77827941 el

número 0.25000000. De nuevo, como 2 se encuentra entre 1.77827941 y 3.16227766,

será necesario, para seguir aproximándonos, encontrar la media geométrica entre estos

dos números, y, de igual forma, la media aritmética entre sus logaritmos. Y así

sucesivamente. De esta manera, por un gran número de operaciones similares,

encontramos que el logaritmo de 2 es 0.3010300, que el de 3 es 0.4771213, etc., sin

tener un grado de exactitud más allá del séptimo lugar decimal. Aún así, el cálculo

precedente es necesario solamente para los números primos, porque los logaritmos de

los números que son el producto de dos o más números, pueden ser encontrados al

considerar la suma de los logaritmos de sus factores.

En cuanto al resto, debido a que el cálculo de logaritmos es ahora una cosa del

pasado, excepto en casos aislados, podría pensarse que los detalles en los que hemos

entrado carecen de valor. Podemos, sin embargo y con justicia, ser lo suficientemente

curiosos para conocer los tortuosos y agotadores caminos por los que los grandes

inventores han pasado, los diferentes pasos que han recorrido para llegar a sus fines, y el

grado en el que estamos en deuda con estos verdaderos benefactores de la humanidad.

Este conocimiento, por otra parte, no es simplemente una curiosidad ociosa. Puede

16

proporcionarnos una guía para investigaciones similares, y arroja una luz creciente

sobre los temas que ahora nos ocupan.

Los logaritmos son un instrumento universalmente empleado en las ciencias, y

en las artes que dependen del cálculo. El siguiente ejemplo constituye una evidente

aplicación de su uso.

Las personas que no son totalmente ignorantes en temas musicales saben que las

distintas notas de una octava son expresadas por números que dan las divisiones de una

cuerda estirada produciendo aquellas notas. Así, la nota principal está denotada por 1, su

octava por 2

1, su quinta por

3

2, su tercera por

5

4, su cuarta por

4

3, su segunda por

9

8,

etc. La distancia de una de estas notas a la siguiente adyacente se llama intervalo, y es

medido, no por la diferencia, sino por la razón de los números expresando los dos

sonidos. Así, el intervalo entre la cuarta y la quinta, que es llamado el tono mayor, está

considerado como doblemente sensible que el que está entre la tercera y la cuarta, que

es llamado el semi-mayor. De hecho, si la primera está expresada por 9

8, y la segunda

por 16

15, se verá que la primera no difiere por mucho del cuadrado de la segunda. Ahora,

es claro que esta concepción sobre los intervalos, sobre los cuales se funda toda la teoría

del temperamento, nos conduce naturalmente a los logaritmos. Porque si expresamos el

valor de las distintas notas por los logaritmos de las longitudes de las cuerdas que

responden a ellas, entonces el intervalo de una nota a otra será expresado por la simple

diferencia de valores de las dos notas; y si fuese requerido dividir la octava en doce

semi-tonos iguales - lo que produciría el temperamento más exacto y simple -

simplemente tendríamos que dividir el logaritmo de una mitad, el valor de la octava, en

doce partes iguales.

17

LECCIÓN II

SOBRE LAS OPERACIONES DE LA ARITMÉTICA

Un antiguo prosista alguna vez dijo que la aritmética y la geometría eran las alas

de las matemáticas. Creo que podemos decir, sin recurrir a metáforas, que estas dos

ciencias son el fundamento y la esencia de todas las ciencias que traten con la magnitud.

Pero no solamente son el fundamento, sino son también, por decirlo de alguna manera,

la piedra angular de estas ciencias. Porque, cuando hemos llegado a un resultado, para

poder hacer uso de él, es un requisito que sea puesto o traducido en números o en líneas;

para traducirlo en números, es necesaria la aritmética; para traducirlo en líneas, tenemos

que recurrir a la geometría.

De acuerdo con esto, la importancia de la aritmética me conduce a una discusión

complementaria sobre el tema hoy en día, aunque hayamos empezado con el álgebra.

Voy a asumir sus diversas partes y a ofrecer nuevas observaciones que servirán para

complementar lo que ya he expuesto a ustedes. Por otra parte, cuando sea necesario haré

uso del cálculo geométrico, con el fin de dar mayor generalidad a las demostraciones y a

los métodos.

Primero, en lo que concierne a la adición, no hay nada nuevo que decir sobre lo

que ya se ha dicho hasta ahora. La adición es una operación tan simple que su concepto

es una cuestión de rutina. Pero en lo que concierne a la sustracción, existe otra forma de

llevar a cabo esta operación, que es frecuentemente más ventajosa que la del método

común, particularmente para aquellos familiarizados con él. Consiste en convertir la

sustracción en adición al tomar el complemento de cada figura del número que vaya a

ser sustraído, primero con respecto a 10, y después con respecto a 9. Supongamos, por

ejemplo, que el número 2635 debe ser sustraído del número 7853.

2635

7853

5218

En lugar de decir que 5 de 13 deja 8; 3 de 4 deja 1; 6 de 8 deja 2; y 2 de 7 deja 5, dando

un remanente total de 5218, yo digo: 5 el complemento de 5 con respecto a 10 añadido a

3 da 8, y escribo 8; 6 el complemento de 3 con respecto a 9 añadido a 5 da 11, y escribo

1 y llevo 1; 3 el complemento de 6 con respecto a 9, más 9, por razón del 1 llevado, da

18

12, y escribo 2 y llevo 1; por último, 7 el complemento de 2 con respecto a 9 más 8, a

cuenta del 1 llevado, da 15, y escribo 5 y esta vez no llevo nada, porque la operación

está completa, y el 10 que fue tomado en préstamo a lo largo de la operación debe ser

rechazado. De esta manera, obtenemos el mismo remanente que arriba, 5218.

El método precedente es extremadamente conveniente cuando los números son

grandes, porque en el método común de sustracción, donde el préstamo es necesario al

sustraer números simples unos de otros, los errores suelen ser muy comunes, mientras

que en el método que nos concierne - y en donde la sustracción se convierte en adición -

nunca tomamos prestados números, sino simplemente los llevamos. En cuanto a los

complementos, suelen ser detectables a simple vista, porque cualquiera sabe que 3 es el

complemento de 7 con respecto a 10, 4 es el complemento de 5 con respecto a 9, etc. Y

en cuanto a la razón de este método, también la causa es muy palpable. Los distintos

complementos, tomados juntos, forman el complemento total del número a ser

sustraído, ya sea con respecto a 10, ó a 100, ó a 1000, etc., dependiendo de si el número

tiene 1, 2, 3… figuras; de manera que la operación realizada es virtualmente equivalente

a primeramente añadir 10, 100, 1000… al minuendo y después tomar el sustraendo del

minuendo así aumentado. Por esto, es igualmente manifiesto por qué el 10 de la suma

encontrada por la última adición parcial debe ser rechazado.

En lo que se refiere a la multiplicación, existen varios métodos abreviados,

basados en el sistema decimal de los números. Al multiplicar por 10, por ejemplo,

simplemente tenemos que añadir una cifra; al multiplicar por 100 tenemos que añadir

dos cifras; por 1000, tres cifras, etc. Consecuentemente, para multiplicar por cualquier

parte alícuota de 10, por ejemplo 5, tenemos que multiplicar por 10 y después dividir

entre 2; para multiplicar por 25, multiplicamos por 100 y dividimos entre 4, y así

sucesivamente para todos los productos de 5.

Cuando los números decimales son multiplicados por números decimales, la

regla general consiste en considerar a los dos números como enteros y, cuando la

operación está terminada, marcar - de derecha a izquierda - tantos lugares en el producto

como haya lugares decimales conjuntamente en el multiplicador y en el multiplicando.

Pero en la práctica, esta regla se encuentra frecuentemente afectada por la

inconveniencia de alargar innecesariamente la operación, porque cuando tenemos

números que contienen decimales, aquellos son ordinariamente exactos sólo a un cierto

número de lugares, por lo cual es necesario conservar en el producto sólo los lugares

decimales de un orden equivalente. Por ejemplo, si el multiplicando y el multiplicador

19

contienen - cada uno de ellos - dos lugares de decimales, y son exactos sólo en dos

lugares decimales, debemos tener en el producto - por el método ordinario - cuatro

lugares decimales, de los cuales debemos rechazar los últimos dos, al ser inútiles e

inexactos. Proporcionaré ahora un método para obtener, en el producto, solamente

tantos lugares decimales como se desee.

Primero, hay que observar que en el método ordinario de multiplicar,

empezamos con las unidades del multiplicador que multiplicamos con las unidades del

multiplicando, y así continuamos de derecha a izquierda. Pero no hay nada que nos

obligue a empezar en la derecha del multiplicador, y podríamos empezar, igualmente

bien, por la izquierda. Y en verdad no puedo comprender por qué no es preferible este

último método, ya que posee las ventajas de dar - de una sola vez - las figuras que

tienen el valor más grande, y, en la mayoría de los casos en donde multiplicamos

números grandes, son estos últimos y más altos lugares los que nos conciernen; de

hecho, frecuentemente realizamos multiplicaciones sólo para encontrar estas últimas

figuras. Y aquí, y esto debe ser remarcado entre paréntesis, yace una de las grandes

ventajas de calcular con logaritmos, que siempre dan, ya sea en la multiplicación o en la

división, en la involución o en la evolución, las figuras en el orden descendente de su

valor, comenzando con los más altos y procediendo de izquierda a derecha.

Al realizar la multiplicación de esta manera, el producto total no se ve afectado.

La única distinción es que, por el nuevo método, la primera línea, el primer producto

parcial, es lo que en el método ordinario está al último, y el segundo producto parcial es

lo que en el método ordinario está junto al último, y así con el resto.

Cuando se trata con números enteros y se requiere el producto exacto, da igual

qué método empleemos. Pero cuando se trata con lugares decimales, lo principal es

tener primero las figuras de los números enteros en el producto, y descender después

sucesivamente a las figuras de las partes decimales, en lugar de, como en el método

ordinario, empezar con los últimos lugares decimales y ascender después sucesivamente

a las figuras que forman los números enteros.

Al aplicar este método en la práctica, escribimos el multiplicador por debajo del

multiplicando, a fin de que la figura de la unidad del multiplicador caiga por debajo de

la última figura del multiplicando. Entonces empezamos con la última figura en la

izquierda del multiplicador, que multiplicamos, como en el método ordinario, por todas

las figuras del multiplicando, empezando con la última de la derecha y procediendo

sucesivamente hacia la izquierda, y observando que la primera figura del producto debe

20

ser puesta por debajo de la figura con la que estamos multiplicando, mientras que las

otras siguen en su orden sucesivo hacia la izquierda. Procedemos de la misma forma

con la segunda figura del multiplicador, poniendo igualmente bajo esta figura la primera

figura del producto, y así con el resto. El lugar del punto decimal en estos diferentes

productos será el mismo que en el del multiplicando, es decir, todas las unidades de los

productos caerán en la misma línea vertical con aquellas del multiplicando, y, por

consiguiente, aquellas unidades de la suma de todos los productos o del producto total,

también caerán en esa línea. De esta forma, es fácil calcular tantos lugares decimales

como queramos. Daré un ejemplo de este método, en el cual el multiplicando es 437.25,

y el multiplicador 27.34:

437.25

27.34

8745 0

3060 75

131 17 5

17 49 00

11954 41 50

He escrito todos los decimales en el producto, pero es fácil ver cómo podemos

omitir calcular los decimales que queremos rechazar. La línea vertical es usada para

marcar distintivamente el lugar del punto decimal. La regla precedente me parece más

simple y natural que la que es atribuida a OUGHTRED§ y que consiste en escribir el

multiplicador por debajo del multiplicando en el orden inverso.

Finalmente, hay otra cuestión que merece ser considerada en conexión con la

multiplicación de números que contienen decimales, y es el que se refiere a que

podemos alterar, a conveniencia, el lugar del punto decimal de cada número. Porque, al

observar que el mover el punto decimal de derecha a izquierda en uno de los números,

es equivalente a multiplicar el número por 10, ó por 100, ó por 1000…, y que el mover

el punto decimal en el otro número el mismo número de lugares de izquierda a derecha

es equivalente a dividir ese número entre 10, 100, ó 1000,…, se sigue que podemos

§ Lagrange se refiere a William Oughtred (1574-1660), un ministro anglicano y matemático inglés. Nota del Traductor.

21

“empujar” el punto decimal hacia delante en uno de los números tantas veces como

queramos, siempre que lo movamos hacia el otro lado en el otro número el mismo

número de lugares, sin alterar de ninguna manera el producto. De esta forma, podemos

hacer que uno de los dos números no contenga decimales, lo que simplifica mucho la

cuestión.

La división es susceptible de una simplificación parecida, porque como el

cociente no se ve alterado al multiplicar o dividir el dividendo y el divisor por el mismo

número, se sigue que en la división podemos mover el punto decimal de ambos números

hacia delante o hacia atrás tantos lugares como queramos, siempre y cuando lo

movamos en la misma distancia en cada caso. Por consiguiente, siempre podemos

reducir el divisor a un número entero, lo que facilita infinitamente la operación, porque

cuando hay lugares decimales solamente en el dividendo, podemos proceder con la

división por el método común y rechazar todos los lugares que dan decimales de un

orden más bajo de los que queremos tomar en cuenta.

Ustedes saben cuál es la propiedad singular del número 9, por la cual si un

número es divisible por 9, la suma de sus dígitos es también divisible por nueve. Esta

propiedad nos permite saber, de manera inmediata, no solamente si un número es

divisible por 9, sino también cuál es el resto de tal división. Porque solamente tenemos

que tomar la suma de sus dígitos y dividir esa suma entre 9, y el resto será el mismo que

el del número original dividido entre 9.

La demostración de la proposición precedente no es difícil. Descansa sobre el

hecho de que los números 10 menos 1, 100 menos 1, 1000 menos 1,…son todos

divisibles entre 9, y es muy obvio que los números resultantes son 9, 99, 999,….

Si, ahora, sustraemos de un número dado la suma de todos sus dígitos,

tendremos como nuestro resto al dígito de las decenas multiplicado por 9, al dígito de

los cientos multiplicado por 99, al dígito de los miles multiplicado por 999, etc., un

resto que es plenamente divisible entre 9. Consecuentemente, si la suma de los dígitos

es divisible por 9, el número original en sí mismo será también divisible, y si no es

divisible por 9, de igual manera el número original tampoco lo será. Pero el resto en un

caso será el mismo que en el otro.

En lo que respecta al número 9, es evidente que 10 menos 1, 100 menos 1,… son

divisibles entre 9; pero el álgebra demuestra que la propiedad en cuestión se mantiene

para cada número a. Porque se puede ver que

22

,...1,1,1,1 432 −−−− aaaa

son todas cantidades divisibles por 1−a , y la división real dando los cocientes

,...1,1,1,1 232 ++++++ aaaaaa

La conclusión es por lo tanto obvia, y es que la propiedad mencionada del

número 9 se mantiene en nuestro sistema decimal aritmético porque 9 es 10 menos 1, y

que en cualquier otro sistema fundado en la progresión ,...,, 32 aaa el número 1−a

tendría la misma propiedad. Así, en un sistema duodecimal, sería el número 11; y en

este sistema cada número, la suma de cuyos dígitos fuese divisible entre 11, también

sería en sí mismo divisible por ese número.

Como se verá ahora, la propiedad precedente del número 9 admite ciertas

generalizaciones. Debido a que cada número en nuestro sistema está representado por la

suma de ciertos términos de la progresión 1, 10, 100, 1000,…, y cada uno multiplicado

por uno de los nueve dígitos 1, 2, 3, 4,…9, es fácil ver que el resto que resulta de la

división de cualquier número por un divisor dado, será igual a la suma de los restos que

resulten de la división de los términos 1, 10, 100, 1000,…, por ese divisor, y cada uno

multiplicado por el dígito que muestra cuántas veces ha sido tomado el término

correspondiente. Por lo tanto, y de manera general, si llamamos al divisor dado D, y si

m, n, p,…, son los restos de la división de los números 1, 10, 100, 1000,…, por D, el

resto de la división de cualquier número N - del cual los caracteres que proceden de

derecha a izquierda son a, b, c,…, - por D, será obviamente igual a

m a + n b + p c…

De acuerdo con esto, si para un divisor dado D conocemos los restos m, n, p,…,

que dependen únicamente de ese divisor, y que son siempre los mismos para el mismo

divisor, solamente tenemos que escribir los restos por debajo del número original,

procediendo de derecha a izquierda, y después encontrar los diferentes productos de

cada dígito del número por el dígito que está debajo de él. La suma de todos estos

productos será el resto total resultante de la división del número propuesto por el mismo

divisor D. Y si la suma encontrada es mayor que D, podemos proceder de la misma

forma para encontrar el resto de la división por D, y así sucesivamente, hasta que

finalmente lleguemos a un resto que sea menor que D, y que será el resto que realmente

buscamos. Se sigue de esto que el número propuesto no puede ser exactamente divisible

por el divisor dado, a menos que el último resto encontrado a partir de este método sea

cero.

23

Los restos resultantes de la división de los términos 1, 10, 100,…1000, por 9,

serán siempre unidad. Por lo tanto, la suma de los dígitos de cualquier número es el

resto resultante de la división de ese número entre 9. Los restos resultantes de la

división de los mismos términos por 8 son 1, 2, 4, 0, 0, 0,… Debemos obtener, según

esto, el resto resultante de dividir cualquier número por 8, al tomar la suma del primer

dígito a la derecha, el siguiente dígito siguiente al mismo, a la izquierda multiplicado

por 2, y el tercer dígito multiplicado por 4.

Los restos que resultan de la división de los términos 1, 10, 100, 1000,…por 7

son 1, 3, 2, 6, 4, 5, 1, 3,…, en donde los mismos restos se repiten continuamente en el

mismo orden. Si ahora tenemos al número 13527541 dividido por 7, lo escribimos, por

tanto, con los restos de arriba por debajo de él:

13527541

31546231

1

12

10

42

8

25

3

3

104

231

4

0

2

6

Al tomar los productos parciales y añadirlos, obtenemos el número 104, que

sería el resto de la división del número dado por 7, si no fuese más grande que el

divisor. Tenemos entonces que repetir la operación con este resto, y encontramos que el

número de nuestro segundo resto es 6, que es el resto que realmente buscamos.

Tenemos que remarcar todavía, con respecto a los restos precedentes y a las

multiplicaciones que resultan de ellos, que pueden ser simplificados al introducir restos

24

negativos en el lugar de los restos que son mayores que la mitad del divisor, y para

hacer esto, simplemente tenemos que sustraer el divisor de cada uno de tales restos. Así,

obtenemos, en lugar de los restos 6, 5, 4, los siguientes:

.3,2,1 −−−

Los restos para el divisor 7 son, de acuerdo con esto,

,...3,1,2,3,1,2,3,1 −−−

y así hasta el infinito.

Entonces, el ejemplo precedente toma la siguiente forma:

13527541

31 231 231

7 1

6 12

10 10

23 3

3

29

sustraer 23

6

He puesto una barra debajo de los dígitos que tienen que ser considerados como

negativos, y he sustraído la suma de los productos de estos números por los de arriba, de

la suma de los otros productos.

Por lo tanto, toda la cuestión se resuelve si encontramos, para cada divisor, los

restos resultantes de dividir 1, 10, 100, 1000, por ese divisor. Esto se puede hacer pronto

a partir de una división efectiva, pero se hace más simple a partir de la siguiente

consideración. Si r es el resto de la división de 10 por un divisor dado, r2 será el resto de

la división de 100, el cuadrado de 10, por ese divisor; y, consecuentemente, será

necesario simplemente sustraer el divisor dado de r2 tantas veces como sea necesario

para obtener un resto - positivo o negativo - que sea menor que la mitad de ese divisor.

25

Dejemos que s sea ese resto; tenemos entonces simplemente que multiplicar s por r, el

resto de la división de 10, para obtener el resto de la división de 1000 por el divisor

dado, porque 1000 es 10100× , y así sucesivamente.

Por ejemplo, al dividir 10 por 7, tenemos un resto de 3; por lo tanto, el resto de

dividir 100 por 7 será 9, o, sustrayendo de 9 el divisor dado 7, 2. El resto de dividir

1000 por 7 será, entonces, el producto de 3 por 2, ó 6, o, sustrayendo el divisor, 7, 1− .

De nuevo, el resto de dividir 10,000 por 7 será el producto de 1− y 3, ó 3− , etc.

Tomemos ahora el divisor 11. El resto de dividir 1 entre 11 es 1, de dividir 10

entre 11 es 10, o, sustrayendo el divisor, .1− El resto de dividir 100 por 11 será,

entonces, el cuadrado de 1− , ó 1; de dividir 1000 por 11 será 1 multiplicado por 1− , ó

1− otra vez, y así por siempre, los restos forman la serie

,...1,1,1,1,1,1 −−−

Por lo tanto, resulta la remarcable propiedad del número 11, a saber, que si los

dígitos de cualquier número son añadidos y sustraídos de manera alternativa, esto es, si

tomamos la suma del primero, del tercero, del quinto, etc., y sustraemos de ella la suma

del segundo, del cuarto, del sexto, etc., debemos obtener el resto que resulta de dividir

ese número por el número 11.

La teoría de los restos expuesta está llena de consecuencias notables, y ha dado

lugar a todo tipo de investigaciones ingeniosas y difíciles. Podemos demostrar, por

ejemplo, que si el divisor es un número primo, los restos de cualquier progresión 1, a,

a2, a3, a4,…, forman periodos que se repetirán de manera continua hasta el infinito, y

que todos los cuales, como el primero, comienzan con unidad, de tal manera que cuando

la unidad aparece entre los restos, podemos continuarlos al infinito simplemente

repitiendo los restos que precedieron. También se ha demostrado que estos periodos

pueden solamente contener un número de términos que es igual al divisor menos 1, o a

una parte alícuota del divisor menos 1. Pero todavía no hemos sido capaces de

determinar a priori este número para cualquier divisor.

En cuanto a la utilidad de este método para encontrar el resto resultante de

dividir un número dado por un divisor dado, basta decir que es sumamente útil cuando

tenemos varios números a ser divididos por el mismo número, y que es necesario para

preparar una tabla de los restos. Dado que la división por 9 y 11 es muy simple, se

puede utilizar como una comprobación de la multiplicación y la división. Habiendo

encontrado los restos de dividir el multiplicando y el multiplicador por cualquiera de

26

estos números, es necesario simplemente tomar el producto de los dos restos así

resultantes, de los cuales, después de sustraer el divisor tantas veces como sea necesario,

debemos obtener el resto de dividir su producto por el divisor dado - un resto que debe

coincidir con el resto obtenido de tratar o considerar al producto real de esta manera -. Y

como en la división el dividendo menos el resto debe ser igual al producto del divisor y

el cociente, la misma comprobación puede resultar ventajosa aquí.

La suposición que acabo de hacer, esto es, que el producto de los restos de

dividir dos números por el mismo divisor es igual al resto de dividir el producto de estos

números por el mismo divisor, se puede probar fácilmente, y daré una demostración

general de ello.

Dejemos que M y N sean dos números, D el divisor, p y q los cocientes, y r, s los

dos restos. Tenemos claramente que

M = pD + r, N = qD + s,

de lo cual, al multiplicar, obtenemos

MN = pqD2 + spD + rqD + rs;

donde se ve claramente que todos los términos son divisibles por D, con la excepción

del último, rs, de donde se sigue que rs será el resto de dividir MN por D. Es también

evidente que si cualquier múltiplo de D, como mD, es sustraído de rs, el resultado de

mDrs − será también el resto de dividir MN por D. Porque, poniendo el valor de MN de

la siguiente forma:

mDrsmDrqDspDpqD −++++2 ,

resulta obvio que los términos restantes son todos divisibles entre D. Y este resto,

mDrs − , siempre se puede hacer menor que D, e incluso, al emplear restos negativos,

menor que .2

D

Esto es todo lo que tengo que decir sobre la multiplicación y la división. No voy

a hablar de la extracción de raíces. La regla es muy simple para las raíces cuadradas y,

al conducirnos directamente a nuestra meta, las pruebas son innecesarias. En cuanto a

los cubos y a raíces más grandes, rara vez surge la ocasión de tener que extraerlas, y,

cuando surge, la extracción puede ser realizada fácilmente por medio de los logaritmos,

y en donde el grado de exactitud puede ser llevado a tantos lugares decimales como los

logaritmos en sí mismos tengan lugares decimales. Así, con logaritmos de siete lugares,

podemos extraer raíces que tengan siete figuras, y con las grandes tablas en donde los

27

logaritmos han sido calculados en diez lugares decimales, podemos obtener diez figuras

del resultado.

Una de las operaciones más importantes de la aritmética es la llamada regla de

tres, que consiste en encontrar el cuarto término de una proporción en la cual los tres

primeros términos nos son dados.

En los libros de texto comunes sobre aritmética esta regla se ha vuelto

innecesariamente complicada, habiendo sido dividida en reglas de tres simples, directas,

inversas, y compuestas. En general, es suficiente con comprender las condiciones del

problema a fondo, porque la regla de tres común resulta siempre aplicable cuando una

cantidad aumenta o disminuye en la misma proporción que otra. Por ejemplo, el precio

de las cosas aumenta en proporción a la cantidad de las cosas, de manera que si la

cantidad de la cosa es duplicada, el precio también será duplicado, y así sucesivamente.

De manera similar, la cantidad de trabajo hecho se incrementa proporcionalmente al

número de personas empleadas. De nuevo, las cosas se pueden incrementar,

simultáneamente, en dos proporciones diferentes. Por ejemplo, la cantidad de trabajo

hecho se incrementa con el número de personas empleadas, y también con el tiempo

durante el cual están empleadas. Además, también hay cosas que disminuyen mientras

otras aumentan.

Todo esto puede ser abarcado por una única y simple proposición. Si una

cantidad incrementa tanto en la razón en la cual una o varias otras cantidades

incrementan, como en la razón en la cual una o varias otras cantidades disminuyen, esto

es lo mismo a decir que la cantidad propuesta se incrementa proporcionalmente al

producto de las cantidades que se incrementan con ella, dividido por el producto de las

cantidades que simultáneamente disminuyen. Por ejemplo, debido a que la cantidad de

trabajo hecho se incrementa proporcionalmente con el número de trabajadores y con el

tiempo durante el cual trabajan, y como disminuye en proporción a medida que el

trabajo se vuelve más difícil, podemos decir que el resultado es proporcional al número

de trabajadores multiplicado por el número encargado de medir el tiempo durante el

cual trabajaron, dividido por el número que mide o expresa la dificultad del trabajo.

El siguiente hecho no debe hacer perder de vista que la regla de tres es

propiamente aplicable sólo a cosas que se incrementan en una razón constante. Por

ejemplo, se asume que si un hombre hace una cierta cantidad de trabajo en un día, dos

hombres harán lo doble en un día, tres hombres el triple, cuatro hombres el cuádruple,

28

etc. En realidad, este no es el caso, pero en la regla de proporción se asume que es así,

porque de otro modo nos sería imposible utilizarla.

Cuando la ley del incremento o de la disminución varía, la regla de tres no es

aplicable, y los métodos ordinarios de la aritmética resultan insuficientes. Tenemos

entonces que recurrir al álgebra. Un barril de cierta capacidad se vacía en un cierto

tiempo. Sería un error concluir, a partir de esto, que un barril con el doble de capacidad

se vaciará en el doble de tiempo, porque en realidad se vaciaría en un tiempo mucho

más corto. La ley de los flujos de salida no sigue una razón constante, sino una razón

variable, que disminuye con la cantidad de líquido restante en el barril.

Sabemos por la mecánica que los espacios recorridos por un cuerpo en

movimiento uniforme guardan una razón constante con el tiempo transcurrido. Si

viajamos un kilómetro en una hora, en dos horas habremos viajado dos kilómetros. Pero

los espacios recorridos por una piedra que cae no guardan una razón fija con el tiempo.

Si cae dieciséis metros en el primer segundo, caerá cuarenta y ocho metros en el

segundo (siguiente) segundo.

La regla de tres es aplicable solamente cuando las razones son constantes. Y, en

la mayoría de las cuestiones de la vida ordinaria, las razones constantes son la regla. En

general, el precio es siempre proporcional a la cantidad, de tal forma que si una cosa

dada tiene un cierto valor, dos tales cosas tendrán el doble de valor, tres tres veces ese

valor, cuatro cuatro veces ese valor, etc. Sucede lo mismo con el producto del trabajo

relativo al número de trabajadores y a la duración del trabajo. Sin embargo, existen

casos en donde somos conducidos al error fácilmente. Si dos caballos, por ejemplo,

jalan una carga de un peso determinado, es natural suponer que cuatro caballos podrían

jalar una carga del doble de peso, y seis caballos una carga del triple de peso. Sin

embargo, estrictamente hablando, tal no es el caso. Porque la inferencia está basada en

la suposición de que cuatro caballos jalan igual en cantidad y dirección, lo que en la

práctica seguramente no sería el caso. Da la casualidad de que frecuentemente llevamos

nuestros cálculos a resultados que divergen ampliamente de la realidad. Pero la culpa no

es de las matemáticas; porque las matemáticas siempre nos devuelven exactamente lo

que hemos puesto en ellas. La razón (proporción), de acuerdo a la suposición, era

constante. El resultado está fundado en esa suposición; si la suposición es falsa, el

resultado es necesariamente falso. Siempre que se ha querido acusar a las matemáticas

de cierta inexactitud, ha sido porque los acusadores han atribuido a las matemáticas el

29

error del calculador. Si éste utiliza datos falsos o inexactos, el resultado será

necesariamente falso o inexacto.

De entre las otras reglas de la aritmética, existe una llamada aligación, que

merece una consideración especial debido a las numerosas aplicaciones que tiene.

Aunque la aligación se usa principalmente al mezclar metales por fusión, es también

aplicada a mezclas de cualquier número de artículos con diferentes valores que deban

ser combinados en un todo con un número igual de partes que tengan un valor medio.

La regla de la aligación, o de las mezclas, tiene dos partes.

En una, buscamos el valor medio y común de cada parte de la mezcla, habiendo

dado el número de las partes y el valor particular de cada una de ellas. En la segunda,

habiendo dado el número total de las partes y de su valor medio, buscamos la

composición de la mezcla en sí misma, o el número proporcional de partes de cada

ingrediente que debe ser mezclado o aligado conjuntamente.

Supongamos, por ejemplo, que tenemos varios bushels** de grano de diferentes

precios, y que queremos saber el precio medio. El precio medio debe ser tal que si cada

bushel fuese de ese precio, el precio total de todos los bushels juntos seguiría siendo el

mismo. Por lo cual es fácil ver que para encontrar el precio medio en el presente caso,

tenemos simplemente que encontrar el precio total y dividirlo por el número de bushels.

Por lo general, si multiplicamos el número de cosas de cada tipo por el valor de

la unidad de ese tipo, y luego dividimos la suma de todos estos productos por (entre) el

número total de cosas, obtendremos el valor medio, porque este valor multiplicado por

el número de cosas producirá el valor total de todas las cosas tomadas conjuntamente.

Este valor medio o valor promedio, como también es llamado, es de gran utilidad para

casi todos los asuntos de la vida. Siempre que lleguemos a un número de diferentes

resultados, siempre queremos reducirlos a una expresión media o promedia, que

producirá el mismo resultado total. Verán ustedes, cuando lleguen al cálculo de

probabilidades, que toda esa ciencia prácticamente se basa en el principio que estamos

discutiendo.

El registro de nacimientos y muertes ha hecho posible la construcción de las

llamadas tablas de mortalidad, que demuestran qué proporción de un número dado de

niños nacidos al mismo tiempo o en el mismo año sobreviven al final de un año, dos

** Un bushel es una unidad de masa, utilizada principalmente en los países anglosajones, usada para medir la compra y venta de granos, harinas, etc.; en francés la palabra es boisseau, y no existe una traducción posible al español, ya que se emplea la misma palabra que en inglés, i. e., bushel. Nota del Traductor.

30

años, tres años, etc. Así que, sobre esta base, podemos preguntar cuál es el valor medio

o promedio de la vida de una persona en cualquier edad dada. Si vemos en las tablas el

número de personas viviendo en una edad determinada, y después añadimos a esto el

número de personas viviendo en todas las edades posteriores, es claro que esta suma nos

dará el número total de años que las personas que viven en la edad en cuestión todavía

vivirán. Consecuentemente, solamente es necesario dividir esta suma entre el número de

personas viviendo en una cierta edad, para obtener la duración promedio de vida de

tales personas, o, mejor aún, el número de años que cada persona debe vivir para que el

número total de años vivido por todos sea el mismo y que cada persona haya vivido un

número igual. A partir de esto, se ha encontrado que, al tomar la media de los resultados

de diferentes tablas de mortalidad, para un infante de un año la duración promedio de

vida es de aproximadamente 40 años; para un niño de diez años es también de 40 años;

para 20 es de 34; para 30 es de 26; para 40 es de 23; para 50 es de 17; para 60 es de 12;

para 70, 8; y para 80, 5.

Para tomar otro ejemplo, consideremos un número de diferentes experimentos

realizados. Tres experimentos han dado 4 como resultado; dos experimentos han dado

5; y uno ha dado 6. Para encontrar la media multiplicamos 4 por 3, 5 por 2, y 1 por 6,

añadimos (sumamos) los productos, lo que da 28, y dividimos 28 por el número de

experimentos, ó por 6, lo que da 3

24 como resultado medio de todos los experimentos.

Pero es evidente que este resultado puede ser considerado como exacto

solamente bajo la condición de haber supuesto que los experimentos fueron hechos con

igual precisión. Pero es imposible que tal cosa haya sido el caso, y es por lo tanto

imperativo tomar en cuenta estas desigualdades, un requerimiento que demandaría un

cálculo mucho más complicado que el que hemos empleado, y que ahora atrae la

atención de los matemáticos.

Lo precedente es la sustancia de la primera parte de la regla de aligación; la

segunda parte es lo opuesto de la primera. Dado el valor medio, encontrar cuánto debe

ser tomado de cada ingrediente para producir el valor medio requerido.

Los problemas de la primera clase están siempre determinados, porque, como

hemos visto, el número de unidades de cada ingrediente simplemente tiene que ser

multiplicado por el valor de cada ingrediente, y la suma de todos estos productos ser

dividida por el número de los ingredientes. Los problemas de la segunda clase, por otra

31

parte, están siempre indeterminados. Pero la condición de que solamente son admitidos

en el resultado números enteros positivos, sirve de límite al número de soluciones.

Supongamos que tenemos dos tipos de cosas, que el valor de la unidad de un

tipo es a, y que el de la segunda es b, y que queremos encontrar cuántas unidades del

primer tipo y cuántas unidades del segundo son necesarias para formar una mezcla o un

todo del cual el valor medio sea m. Llamemos x al número de unidades del primer tipo

que deben entrar en la mezcla, e y al número de unidades del segundo tipo. Es claro que

ax será el valor de las x unidades del primer tipo, y by el valor de las y unidades del

segundo. Por lo tanto, ax + by será el valor total de la mezcla. Pero, siendo por

suposición m el valor medio de la mezcla, la suma x + y de las unidades de la mezcla

multiplicada por m - el valor medio de cada unidad - debe producir el mismo valor total.

Tendremos, por consiguiente, la ecuación

.mymxbyax +=+

Transponiendo a un lado los términos multiplicados por x y al otro lado los términos

multiplicados por y, obtenemos:

.)()( ybmxma −=−

y dividiendo entre ma − obtenemos

,)(

ma

ybmx

−−=

donde parecería que el número y puede ser tomado a placer, porque cualquiera sea el

valor dado a y, habrá siempre un valor correspondiente de x que satisfará el problema.

Tal es la solución general que el álgebra ofrece. Pero si la condición es que los

dos números, x e y, sean enteros, entonces y no puede ser tomado a placer. Para ver

cómo podemos satisfacer esta última condición de la manera más simple, dividamos la

última ecuación por y, y tendremos

.ma

bm

y

x

−−=

Para que x e y sean ambas positivas, es necesario que las cantidades bm− y ma −

tengan ambas el mismo signo; es decir, si a es mayor o menor que m, entonces,

inversamente, b debe ser menor o mayor que m; o, en otras palabras, m debe estar entre

a y b, lo que es evidente dada la condición del problema. Supongamos, entonces, que a

es el mayor y b el menor de los dos precios. Queda por encontrar el valor de la fracción

,ma

bm

−−

32

que, si es necesario, puede ser reducida a sus términos más bajos. Dejemos que B

A sea

esa fracción reducida a sus términos más bajos. Es evidente que la solución más simple

será aquella en donde x = A e y = B. Pero como una fracción no se altera al multiplicar

su numerador y multiplicador por el mismo número, es claro que podemos también

tomar x = nB e y = nA, n siendo cualquier número entero, porque supusimos que x e y

son enteros. Y es fácil probar que estas expresiones de x e y son las únicas que

resolverán el problema propuesto. De acuerdo con la regla ordinaria de mezclas, x, la

cantidad del ingrediente más caro, es hecha igual a bm− , el exceso del precio

promedio por encima del precio más bajo, e y, la cantidad del ingrediente más barato,,

es hecha igual a ma − , el exceso del precio más alto por encima del precio promedio;

una regla que está contenida directamente en la solución general dada arriba.

Supongamos, ahora, que en lugar de dos tipos de cosas, tenemos tres tipos, los

valores de los cuales, empezando con los más altos, son a, b, y c. Dejemos que x, y, z

sean las cantidades que deben ser tomadas de cada una para formar una mezcla o

compuesto que tenga el valor medio m. La suma de los valores de las tres cantidades x,

y, z, será entonces .czbyax ++ Pero este valor total debe ser el mismo que el producido

si todos los valores individuales fuesen m, en cuyo caso el valor total es obviamente

.mzmymx ++ La siguiente ecuación, por lo tanto, debe ser satisfecha:

,mzmymxczbyax ++=++

o, de manera más simple,

.0)()()( =−+−+− zmcymbxma

Como hay tres cantidades desconocidas en esta ecuación, dos de ellas pueden ser

tomadas a placer. Pero si la condición es que deben ser expresadas por enteros

positivos, debe observarse, primero, que los números ma − y cm− son

necesariamente positivos; de manera que al poner la ecuación en la forma

,)()()( ybmzcmxma −=−−−

la cuestión se resuelve por sí misma al encontrar dos múltiplos de los números dados

ma − y cm− , cuya diferencia debe ser igual a .)( ybm−

Esta cuestión es siempre resoluble en números enteros, cualesquiera sean los

números dados de los que buscamos los múltiplos, y cualquiera sea la diferencia entre

estos múltiplos. Debido a que es lo suficientemente notable por sí misma, y que puede

33

ser de utilidad en muchas emergencias, daremos una solución general de ella, derivada

de las propiedades de las fracciones continuas.

Sean M y N dos números enteros. De estos dos números, se buscan dos múltiplos

xM, zN, cuya diferencia está dada y es igual a D. Entonces, tiene que ser satisfecha la

siguiente ecuación

,DzNxM =−

donde x, y x son, por suposición, números enteros. En primer lugar, resulta obvio que si

M y N no son primos entre sí, el número D es divisible por el máximo común divisor de

M y N; y, habiendo sido hecha la división, debemos tener una ecuación similar en donde

los números M y N sean primos entre sí, de manera que estamos siempre en libertad de

suponerlos reducidos a esa condición. Observo ahora que si sabemos la solución de la

ecuación para el caso en donde el número D es igual a +1 ó 1− , podemos deducir la

solución a partir de esto para cualquier valor de D. Por ejemplo, supongamos que

conocemos dos múltiplos de M y N, digamos pM y qN, cuya diferencia, qNpM − es

igual a .1± Entonces simplemente tenemos que multiplicar estos (ambos) múltiplos por

el número D para obtener una diferencia igual a D± . Y esto es porque, multiplicando la

ecuación precedente por D, tenemos

;DqDNpDM ±=−

y, sustrayendo la última ecuación de la ecuación original

,DzNxM =−

o añadiéndola, de acuerdo con si el término D tiene el signo −+ o ante él, obtenemos

,0)()( =− NqDzMpDx mm

que produce en seguida, como vimos arriba en la regla para la mezcla de dos

ingredientes diferentes,

,, nMqDznNpDx == mm

n siendo cualquier número. De manera general, tenemos

pDnNx ±= y qDnMz ±=

donde n es cualquier número entero, positivo o negativo. Queda solamente encontrar

dos números p y q tales que

.1±=− qNpM

Esta cuestión es fácilmente resoluble con la ayuda de las fracciones continuas. Porque

hemos visto, al tratar con estas fracciones, que si la fracción N

M es reducida a una

34

fracción continua, y se calculan todas las fracciones sucesivas que se aproximan a su

valor, la última de estas fracciones sucesivas siendo la fracción N

M en sí misma,

entonces la serie de las fracciones así alcanzadas es tal que la diferencia entre

cualesquiera dos fracciones consecutivas es siempre igual a la fracción de la cual el

numerador es unidad y el denominador el producto de los dos denominadores. Por

ejemplo, al designar por L

K a la fracción que inmediatamente precede a la última

fracción N

M, obtenemos necesariamente

1=− KNLM ó 1− ,

de acuerdo con esto, a si N

M es mayor o menor que

L

K; en otras palabras, de acuerdo a

si el lugar ocupado por la última fracción N

M en la serie de fracciones sucesivas

aproximándose a su valor es par o impar; porque, la primera fracción de la serie que se

aproxima es siempre más pequeño, el segundo más grande, el tercero más pequeño, etc.,

que la fracción original, que es idéntica a la última fracción de la serie. Haciendo, por lo

tanto, que p = L y q = K, el problema de los dos múltiplos se resuelve en toda su

extensión.

Es evidente ahora que, para aplicar la solución precedente a la cuestión inicial

relativa a la aligación, simplemente tenemos que poner

,, cmNmaM −=−= y ;)( ybmD −=

de tal manera que el número y sigue siendo indeterminado y puede ser tomado a placer,

como también puede serlo el número N, que aparece en la expresión por x y z.

35

LECCIÓN III

SOBRE ÁLGEBRA, Y PARTICULARMENTE SOBRE LA

RESOLUCIÓN DE ECUACIONES DE TERCER Y CUARTO GRADO

El álgebra es una ciencia que le debemos casi enteramente a los modernos. Digo

casi enteramente, porque tenemos un tratado escrito por los griegos, particularmente por

DIOFANTO, quien vivió en el siglo tercero de la era cristiana. Este trabajo es el único

que le debemos a los antiguos sobre esta rama de las matemáticas. Y cuando hablo de

los antiguos, me refiero solamente a los griegos, porque los romanos no dejaron

aportación alguna a las ciencias, y, al parecer, tampoco hicieron nada con respecto a

ellas.

DIOFANTO puede ser considerado como el inventor del álgebra. A partir de

unas palabras escritas en su prefacio, o mejor dicho en su carta de dedicación (porque

los geómetras antiguos solían dirigir sus producciones a ciertos amigos suyos, una

práctica ejemplificada en los prefacios de APOLONIO y ARQUÍMEDES); de unas

palabras en su prefacio, decía, sabemos que fue el primero en ocuparse de la rama de la

aritmética que desde entonces ha sido llamada álgebra.

Su trabajo contiene los primeros elementos de esta ciencia. Empleó, para

expresar la cantidad desconocida, una letra griega que corresponde a nuestro er††, y que

ha sido reemplazada, en las traducciones, por N. Para expresar las cantidades conocidas,

empleó únicamente números, porque el álgebra estaba destinada a estar restringida a la

solución de problemas numéricos. Encontramos, sin embargo, que al establecer sus

ecuaciones consonantemente con las condiciones del problema, utiliza las cantidades

conocidas y las desconocidas de igual forma. Y en esto consiste virtualmente la esencia

del álgebra, en emplear cantidades desconocidas, para calcular con ellas como lo

hacemos con las cantidades conocidas, y formar de ellas una o varias ecuaciones desde

las cuales el valor de las cantidades desconocidas pueda ser determinado. Aunque el

trabajo de DIOFANTO contiene casi exclusivamente problemas indeterminados, la

solución de los cuales la busca en los números racionales - problemas que han sido

designados, después de él, como problemas diofánticos -, encontramos en su trabajo, sin

†† Con er, me refiero a la abreviación de algunos números ordinales, tales como primer, tercer, etc. Nota del Traductor.

36

embargo, la solución a un número de problemas determinados del primer grado, e

incluso algunos que involucran varias cantidades desconocidas. En el último caso, sin

embargo, el autor invariablemente recurre a artificios particulares para reducir el

problema a una única cantidad desconocida, lo que no es difícil. Da también la solución

a ecuaciones de segundo grado, pero es cuidadoso para arreglarlas de tal manera que

nunca asuman la afectada forma que contiene al cuadrado y a la primera potencia de la

cantidad desconocida.

Propuso, por ejemplo, la siguiente cuestión, que involucra la teoría general de

ecuaciones del segundo grado.

Encontrar dos números, de los cuales la suma y el producto sean dados.

Si llamamos a la suma a y al producto b, tenemos inmediatamente, por la teoría de las

ecuaciones, la ecuación

.02 =+− baxx

DIOFANTO resuelve este problema de la siguiente manera. Siendo dada la suma de los

dos números, busca su diferencia, y toma a esto último como la cantidad desconocida.

Después expresa los dos números en términos de su suma y diferencia - uno por la

mitad de la suma más la mitad de la diferencia, el otro por la mitad de la suma menos la

mitad de la diferencia -, y luego simplemente tiene que satisfacer la otra condición al

igualar su producto con el número dado. Si llamamos a la suma dada a, y a la diferencia

desconocida x, uno de los números será 2

xa +, y el otro será .

2

xa − Multiplicando a

estos conjuntamente tenemos .4

22 xa − El término que contiene a x es eliminado, e,

igualando la última cantidad obtenida con el producto dado, tenemos la ecuación simple

,4

22

bxa =−

de lo cual obtenemos

,422 bax −=

y de esto último

.42 bax −=

DIOFANTO resuelve varios otros problemas de esta clase. Al tratar

adecuadamente a la suma o a la diferencia como la cantidad desconocida, siempre llega

37

a una ecuación en la que simplemente tiene que extraer una raíz cuadrada para

solucionar el problema.

Pero en los libros que han llegado a nosotros (porque el trabajo completo de

DIOFANTO no ha sido preservado), este autor no procede más allá de las ecuaciones de

segundo grado, y no sabemos si él o alguno de sus sucesores (porque ningún otro

trabajo sobre esta materia ha sido transmitido desde la antigüedad) llevó sus

investigaciones más allá de este punto.

Todavía tengo que comentar, en conexión con el trabajo de DIOFANTO, que él

enunció el principio de que, en la multiplicación, + y −− da , y que −− y da + , en

forma de definición. Pero soy de la opinión de que esto es un error de los copistas,

porque él debió de haber considerado esto como un axioma, tal como EUCLIDES lo

hizo para algunos principios de la geometría. Haya sido como haya sido, se verá que

DIOFANTO consideró la regla de los signos como un principio evidente por sí mismo,

y que no necesitaba de demostración alguna.

El trabajo de DIOFANTO tiene un valor incalculable, porque contiene los

primeros gérmenes de una ciencia que, debido al enorme progreso que desde entonces

ha tenido, constituye una de las mayores glorias del intelecto humano. DIOFANTO no

fue conocido en Europa sino hasta finales del siglo dieciséis, cuando, en 1575, Xylander

hizo una miserable traducción de su obra, basado en un manuscrito encontrado a

mediados del siglo dieciséis en la biblioteca del Vaticano, y que probablemente fue

llevado desde Grecia cuando los turcos tomaron posesión de Constantinopla.

Bachet de Méziriac, uno de los primeros miembros de la Academia Francesa, y

un matemático tolerablemente bueno para su época, publicó, en 1621, una nueva

traducción del trabajo de DIOFANTO, acompañada por largos comentarios, hoy

superfluos. La traducción de Bachet fue después reimpresa, con observaciones y notas,

por FERMAT, uno de los matemáticos más célebres de Francia, quien vivió a mediados

del siglo diecisiete, y del que tendremos ocasión de hablar más adelante, debido a los

importantes descubrimientos que hizo en el análisis. La edición de FERMAT es del año

1670. Es muy deseable que se hagan buenas traducciones, no solamente del trabajo de

DIOFANTO, sino también del pequeño número de trabajos matemáticos que los griegos

nos heredaron.

Sin embargo, anteriormente al descubrimiento y publicación de los trabajos de

DIOFANTO, el álgebra ya era conocida en Europa. A finales del siglo quince, apareció

en Venecia un trabajo sobre aritmética y geometría, realizado por un monje franciscano

38

italiano llamado Luca Pacioli, en el que se establecían las reglas elementales del

álgebra. Este libro fue publicado en 1494, cuando apenas se había inventado la

imprenta, y el hecho de que el nombre álgebra fuese dado a esta nueva ciencia,

demuestra claramente que proviene de los árabes. Es verdad que el significado de esta

palabra árabe es discutido, pero no nos entretendremos con estas cuestiones, porque son

ajenas a nuestro propósito. Sea suficiente con decir que la palabra se ha convertido en el

nombre de una ciencia que es universalmente conocida, y que no existe ningún tipo de

ambigüedad referente a su significado, ya que, hasta el tiempo presente, nunca ha sido

empleada para designar algo más.

No sabemos si el álgebra fue inventada por los árabes, o si éstos la tomaron de

los griegos. Existen razones para creer que estaban en posesión del trabajo de

DIOFANTO, porque cuando las épocas de barbarismo e ignorancia que siguieron a sus

primeras conquistas habían pasado, empezaron a dedicarse a las ciencias y a traducir al

árabe todos los trabajos griegos que trataran sobre temas científicos. Es razonable

suponer, por lo tanto, que también tradujeron el trabajo de DIOFANTO, y que este

mismo trabajo los estimuló para llevar más lejos sus investigaciones sobre esta ciencia.

Sea como fuere, los europeos, habiendo recibido el álgebra de los árabes,

estaban en posesión de ella cientos de años antes de que el trabajo de DIOFANTO fuese

conocido por ellos. Sin embargo, no hicieron un progreso más allá de ecuaciones de

primer y segundo grado. En el trabajo de Pacioli, que mencionamos arriba, la resolución

general de ecuaciones de segundo grado, tal como la tenemos ahora, no estaba dada. En

este trabajo, encontramos simples reglas, expresadas en deficientes versos latinos, para

resolver cada caso particular de acuerdo con las diferentes combinaciones de los signos

de los términos de la ecuación, e inclusive estas reglas solamente aplicaban a los casos

en donde las raíces fuesen reales y positivas. A las raíces negativas, todavía se las

consideraba como superfluas y sinsentido. Realmente, fue la geometría la que nos

sugirió el uso de cantidades negativas, y en esto consiste uno de los mayores avances

que han resultado de la aplicación del álgebra a la geometría, un paso que debemos a

DESCARTES.

En el periodo posterior, se investigó la resolución de ecuaciones de tercer grado,

y el descubrimiento para un caso particular fue hecho por un matemático de Bolonia,

llamado Scipio Ferreus (1515). Dos otros matemáticos italianos, Tartaglia y Cardano,

perfeccionaron la solución dada por Ferreus y la hicieron general para todas las

ecuaciones de tercer grado. En este periodo, Italia, que era la cuna del álgebra en

39

Europa, era prácticamente la única cultivadora de la ciencia, y no fue hasta mediados

del siglo dieciséis cuando otros tratados sobre álgebra empezaron a aparecer en Francia,

Alemania, y en otros países. Los trabajos de Pelletier y de Buteo fueron los primeros

que Francia produjo sobre esta ciencia; el tratado del primero fue impreso en 1554, y el

del segundo en 1559.

Tartaglia expuso su solución en un trabajo (1546) - y en deficientes versos

italianos - que trataba diversas cuestiones e invenciones, y que tiene la distinción de ser

uno de los primeros en tratar el moderno tema de las fortificaciones de bastiones.

Aproximadamente al mismo tiempo (1545), Cardano publicó su tratado Ars

Magna, o Algebra, y en el que dejó casi nada sobre la resolución de ecuaciones de tercer

grado. Cardano fue el primero en percibir que las ecuaciones tienen varias raíces, y en

distinguirlas en positivas y negativas. Pero es particularmente conocido por haber sido

el primero en hacer observaciones sobre el llamado caso irreductible, en el cual la

expresión de las raíces reales aparece en una forma imaginaria. Cardano estaba

convencido, sobre ciertos casos especiales en donde la ecuación tenía divisores reales,

que la forma imaginaria no evitaba que las raíces tuvieran un valor real. Pero aún estaba

por probarse no sólo que las raíces eran reales en el caso irreductible, sino que era

imposible que las tres - conjuntamente - fueran reales, excepto en ese caso. Esta prueba

fue suministrada más tarde por Vieta, y particularmente por Albert Girard, a partir de

consideraciones relacionadas con la trisección de un ángulo.

Volveremos más tarde al caso irreductible de las ecuaciones de tercer grado, no

solamente porque presenta una nueva forma de expresión algebraica que ha encontrado

una aplicación extensa en el análisis, sino porque constantemente está dando lugar a

investigaciones improductivas, que intentan reducir la forma imaginaria a una forma

real, y porque, debido a esto, se presenta en el álgebra un problema que puede ser

puesto a la altura de los problemas concernientes a la duplicación del cubo y al

cuadrado del círculo, en geometría.

Los matemáticos del periodo que estamos hablando, acostumbraban proponerse

trabajos entre ellos para ser solucionados. Estos problemas representaban desafíos

públicos, y servían para estimular y mantener en la mente de los pensadores la

fermentación necesaria para la búsqueda científica. Los desafíos continuaron siendo

comunes entre los matemáticos europeos hasta principios del siglo dieciocho, y no

cesaron sino hasta el surgimiento de las academias, que cumplieron el mismo fin pero

de una manera mucho más conducente para el progreso de la ciencia, en parte debido a

40

la unión de conocimiento de sus distintos miembros, en parte debido a las relaciones

que mantenían entre ellos, y en parte también debido a la publicación de sus memorias,

que servían para diseminar los nuevos descubrimientos y observaciones entre todas las

personas interesadas en la ciencia.

Los desafíos de los que estamos hablando, suplieron, en buena medida, la falta

de academias, que aún no existían, y les debemos muchos descubrimientos importantes

en análisis. Uno de ellos fue la resolución de ecuaciones de cuarto grado, que fue

propuesta en el siguiente problema.

Encontrar tres números en proporción continua, de los cuales la suma es 10, y

el producto de los dos primeros 6.

Generalizando y llamando a la suma de los tres números a, al producto de los

primeros dos b, y a los primeros dos números x, y, debemos tener, primero, xy = b.

Debido a la proporción continua, el tercer número será expresado por ,2

x

y de tal forma

que la condición restante será

.2

ax

yyx =++

De la primera ecuación, obtenemos ,y

bx = que, sustituida en la segunda, da

.3

ab

yy

y

b =++

Removiendo las fracciones y arreglando (acomodando) los términos, finalmente

tenemos

,0224 =+−+ babybyy

una ecuación de cuarto grado en donde falta el segundo término.

De acuerdo con Bombelli, de quien hablaremos más después, Luigi Ferrari de

Bolonia, resolvió el problema a partir de un método sumamente ingenioso, y que

consiste en dividir la ecuación en dos partes que (ambas) permiten la extracción de la

raíz cuadrada. Para hacer esto, es necesario añadir a los dos números cantidades cuya

determinación dependa de una ecuación del tercer grado, de manera que la resolución de

ecuaciones de cuarto grado, depende de la resolución de ecuaciones de tercer grado, y

esto está sujeto, por lo tanto, a los mismos inconvenientes que el caso irreductible.

El Algebra de Bombelli fue impresa en Bolonia en 1579 en italiano. Contiene no

sólo el descubrimiento de Ferrari, sino también otras observaciones importantes sobre

41

ecuaciones de segundo y tercer grado, y particularmente sobre la teoría de los radicales

por medio de los cuales, el autor, tuvo éxito para extraer las raíces cúbicas imaginarias

de los dos binomios de la fórmula del tercer grado en el caso irreductible, encontrando

así un resultado perfectamente real, y proporcionando, a su vez, la prueba más

posiblemente directa sobre la realidad de este tipo de expresiones.

Tal es la sucinta historia del primer progreso del álgebra en Italia. La solución de

ecuaciones de tercer y cuarto grado se consiguió rápidamente. Pero, por más de dos

siglos, los esfuerzos de los matemáticos han resultado infructíferos para superar las

dificultades que implica la ecuación de quinto grado.

Aún así, estos esfuerzos están lejos de ser en vano. Han dado lugar a muchos

preciosos teoremas que poseemos para la formación de ecuaciones, al carácter y signos

de las raíces, a la transformación de una ecuación dada en otras, en las cuales las raíces

pueden ser formadas a placer desde las raíces de la ecuación dada, y, finalmente, a las

bellas consideraciones concernientes a la metafísica de la resolución de ecuaciones, de

las cuales ha resultado, cuando ha sido posible, el método más directo para llegar a su

solución. Todo esto ha sido presentado a ustedes en lecciones previas, y es deseable que

fuese aplicable a la resolución de ecuaciones de más alto grado.

Vieta y Descartes en Francia, Harriot en Inglaterra, y Hudde en Holanda, fueron

los primeros, después de los italianos que acabamos de mencionar, en perfeccionar la

teoría de las ecuaciones, y debido a que desde su tiempo apenas existen matemáticos de

nota que no se hayan dedicado a estas investigaciones, de manera que en el estado

presente esta teoría es el resultado de muchas investigaciones diferentes, es

extremadamente difícil asignar un autor a cada uno de los numerosos descubrimientos

que la constituyen.

Había prometido volver al caso irreductible. Para este fin, será necesario

recordar el método que parece haber llevado a la resolución original de las ecuaciones

de tercer grado, y que todavía es utilizado en la mayoría de los tratados sobre álgebra.

Consideremos la ecuación general de tercer grado, privada de su segundo término, que

siempre puede ser removido; en una palabra, consideremos la ecuación

.03 =++ qpxx

Supongamos que

,zyx +=

42

donde y y z son dos nuevas cantidades desconocidas, de las cuales una puede ser tomada

a placer y determinada como pensemos más conveniente. Sustituyendo este valor por x,

obtenemos la ecuación transformada

.0)(33 3223 =++++++ qzypzyzzyy

Factorizando los dos términos 22 33 yzzy + obtenemos

),(3 zyyz +

y la ecuación transformada puede ser escrita como sigue:

.0))(3(33 =+++++ qzypyzzy

Poniendo el factor que multiplica a zy + igual a cero - lo que es permisible debido a las

dos cantidades indeterminadas involucradas -, debemos tener las ecuaciones

03 =+ pyz

y

,033 =++ qzy

a partir de lo cual y y z pueden ser determinadas. El medio que más naturalmente surge

para este fin es tomar de la primera ecuación el valor de z,

,3y

pz −=

y sustituirlo en la segunda ecuación, eliminando las fracciones por multiplicación.

Procediendo así, obtenemos la siguiente ecuación de sexto grado en y, llamada la

ecuación reducida,

,027

336 =−+ p

qyy

y que, debido a que contiene solamente dos potencias de la cantidad desconocida, una

de las cuales es el cuadrado de la otra, se resuelve a la manera de ecuaciones de segundo

grado, y da

,2742

323 pqq

y ++−=

de la cual, al extraer la raíz cúbica, tenemos

3

32

,2742

pqqy ++−=

y, finalmente,

43

.3y

pyzyx −=+=

Esta expresión para x puede ser simplificada al observar que el producto de y por el

radical

3

32

2742

pqq +−−

suponiendo multiplicadas conjuntamente a todas las cantidades bajo el signo, es

3

3

.327

pp −=−

El término y

p

3, de acuerdo con esto, toma la forma

3

32

,2742

pqq +−−−

y tenemos que

3

32

2742

pqqx ++−= + 3

32

,2742

pqq +−−

una expresión en donde la raíz cuadrada que está por debajo del radical cúbico aparece

en formas de más y menos, y, consecuentemente, no hay lugar para la ambigüedad a

este respecto.

Esta última expresión es conocida como la regla de Cardano, y hasta ahora no

ha habido algún método ideado para la resolución de ecuaciones de tercer grado que no

conduzca a él. Debido a que los radicales cúbicos presentan naturalmente un único

valor, durante mucho tiempo se pensó que la regla de Cardano podía solamente dar una

de las raíces de la ecuación, y que para encontrar las otras dos, debíamos recurrir a la

ecuación original y dividirla por ax− , a siendo la primera raíz encontrada. El cociente

resultante, siendo una ecuación de segundo grado, podía ser resuelto en la manera usual.

La división en cuestión no es solamente siempre posible, sino que también es muy fácil

de realizar. Porque, en el caso que estamos considerando, siendo la ecuación

,03 =++ qpxx

si a es una de las raíces, tenemos

,03 =++ qpaa

y que, sustraída de lo precedente, dará

44

,0)(33 =−+− axpax

una cantidad divisible por ax− , y que tiene como su cociente resultante

;022 =+++ paaxx

de manera que la nueva ecuación a ser resuelta con el fin de encontrar las otras dos

raíces, será

,022 =+++ paaxx

de la cual tenemos, en seguida

.4

3

2

2ap

ax −−±−=

Veo por el Algebra de Clairaut, impresa en 1746, y por el artículo de

D’Alembert sobre el Caso Irreductible en la primera Enciclopaedia, que la idea a la que

nos referimos prevalecía incluso en ese periodo. Pero constituiría una gran injusticia

para el álgebra el acusarla de no producir resultados que posean toda la generalidad de

la que es susceptible la cuestión. El único requisito es ser capaces de leer la escritura

del álgebra, y entonces podremos ver en ella todo lo que por su naturaleza puede hacer

para contener. En el caso que estamos considerando, olvidamos que cada raíz cúbica

puede tener tres valores, así como cada raíz cuadrada tiene dos. Porque la extracción de

la raíz cúbica de a, por ejemplo, es meramente equivalente a la resolución de la

ecuación del tercer grado .03 =− ax Haciendo que 3 ,ayx = esta última ecuación se

convierte en la forma más simple 013 =−y , teniendo como raíz .1=y Después,

dividiendo por ,1−y tenemos

,012 =++ yy

a partir de lo cual deducimos directamente las otras dos raíces

.2

31 −±−=y

De acuerdo con esto, estas tres raíces son las tres raíces cúbicas de unidad, y pueden ser

hechas para dar las tres raíces cúbicas de cualquier otra cantidad a al multiplicarlas por

la raíz cúbica ordinaria de esa cantidad. Es lo mismo con las raíces de cuarto, quinto, y

todos los grados siguientes. Por razones de brevedad, designemos las dos raíces

2

31 −+− y ,

2

31 −−−

45

como m y n. Se verá que son imaginarias, aunque su cubo sea real e igual a 1, y

podemos convencernos fácilmente de esto si las elevamos a la tercera potencia.

Tenemos, por lo tanto, para las tres raíces cúbicas de a,

3 ,a 3 ,am 3 .an

Ahora bien, en la resolución de la ecuación de tercer grado que consideramos

arriba, al llegar a la expresión reducida ,3 Ay = donde por brevedad supusimos

,2742

32 pqqA ++−=

deducimos solamente el siguiente resultado:

3 .Ay =

Pero por lo que acabamos de ver, es claro que no tendríamos que tener solamente

3 ,Ay =

sino también

3 Amy = ; 3 .Any =

La raíz x de la ecuación de tercer grado que encontramos igual a

,3y

py −

tendrá, debido a esto, los siguientes tres valores

3 A ,33 A

p− 3 Am ,3 3 Am

p− 3 An ,3 3 An

p−

y que serán las tres raíces de la ecuación propuesta. Pero al hacer que

,2742

32 pqqB +−−=

es claro que

,27

3pAB −=

donde

3 A 3 B× .3

p−=

Sustituyendo 3 B por 33 A

p− , y señalando que 1=mn , y que consecuentemente

,1

,1

mn

nm

==

46

las tres raíces que estamos considerando serán expresadas como sigue:

3 Ax = 3 B+ , x= 3 Am 3 Bn+ ,

3 Anx = .3 Bm+

Podemos ver, de acuerdo con esto, que cuando es propiamente entendido, el

método ordinario da directamente las tres raíces, y solamente da tres. He creído

necesario entrar en estos pequeños detalles por la razón de que, por un lado, al método

se le ha acusado de ser solamente capaz de dar una sola raíz, y por el otro lado, cuando

se ha visto que realmente da tres, se ha pensado que debió haber dado seis, debido al

falso empleo de todas las combinaciones posibles de las tres raíces cúbicas de unidad, a

saber, 1, m, n, con los dos radicales cúbicos 3 A y .3 B

Pudimos haber llegado directamente a los resultados que acabamos de encontrar

al observar que las dos ecuaciones

033 =++ qzy y 03 =+ pyz

dan

qzy −=+ 33 y ;27

333 p

zy −=

donde en seguida se verá que 3y y 3z son las raíces de una ecuación de segundo grado

de la cual el segundo término es q y el tercero .27

3p− Esta ecuación, que es llamada la

ecuación reducida, tendrá entonces la forma

;027

32 =−+ p

quu

y si llamamos a sus dos raíces A y B, inmediatamente tendremos

3 ,Ay = 3 Bz = ,

donde se observará que A y B tienen los mismos valores que los que tenían en la

discusión previa. Ahora, a partir de lo que ha pasado antes, igualmente tendremos

3 Amy = ó 3 ,Any =

y lo mismo será válido para z. Pero la ecuación

3

pzy −= ,

de la cual solamente hemos empleado el cubo, limita estos valores, y es fácil ver que la

restricción requiere que los tres valores correspondientes de z sean

47

3 ,B 3 ,Bn 3 Bm ;

de donde se sigue que, para el valor de x, que es igual a zy + , son los mismos tres

valores que encontramos arriba.

En cuanto a la forma de estos valores, es evidente, primero, que mientras que A

y B sean cantidades reales, solamente uno de ellos puede ser real, porque m y n son

imaginarias. Consecuentemente, solamente pueden ser los tres reales en el caso en

donde las raíces A y B - de la ecuación reducida - sean imaginarias, esto es, cuando la

cantidad

274

32 pq +

por debajo del signo radical sea negativa, lo que sucede solamente si p es negativa y

mayor que

3

2

.4

3q

Y este es el llamado caso irreducible.

Ya que aquí

274

32 pq +

es una cantidad negativa, supongámosla igual a 2g− , g siendo cualquier cantidad real.

Entonces haciendo que, en aras de la simplicidad,

,2

fq =−

las dos raíces A y B - de la ecuación reducida - asumen la forma

,1−+= gfA .1−−= gfB

Ahora yo digo que si 3 A + 3 B , que es una de las raíces de la ecuación de

tercer grado, es real, entonces las otras dos raíces, expresadas por

3 Am + 3 Bn y 3 An + 3 Bm ,

también serán reales. Pongamos que

3 A ,t= 3 B ;u=

tendremos

,hut =+

donde h, por hipótesis, es una cantidad real. Ahora,

48

3 ABtu = y ,22 gfAB +=

por lo tanto

3 22 ;gftu +=

y, elevando la ecuación hut =+ al cuadrado, tenemos

;2 222 hutut =++

de la cual, sustrayendo 4tu, obtenemos

3 2222 .4)( gfhut +−=−

Observo que esta cantidad necesariamente tiene que ser negativa, porque si fuese

positiva e igual a 2k , tendríamos

,)( 22 kut =−

donde

kut =− ,

Entonces como

,hut =+

se sigue que

2

kht

+= y ,2

khu

−=

siendo ambas cantidades reales. Pero entonces 3t y 3u serían también cantidades reales,

lo que es contrario a nuestra hipótesis, dado que estas cantidades son iguales a A y B,

ambas siendo imaginarias.

La cantidad

3 222 4 gfh +−

por consiguiente, es necesariamente negativa. Supongamos que es igual a ;2k−

tendremos entonces que

,)( 22 kut −=−

y, extrayendo la raíz cuadrada,

;1−=− kut

donde

3

2

1A

kht =−+= , 3 .

2

1B

khu =−−=

Tal será, necesariamente, la forma de los dos radicales cúbicos

49

3 1−+ gf y 3 ,1−− gf

una forma a la que podemos llegar directamente al expandir estas raíces en series de

acuerdo con el teorema newtoniano. Pero debido a que las pruebas por series suelen

dejar alguna duda en la mente, he buscado hacer que la discusión precedente esté libre

de ellas.

Si, por lo tanto,

3 A 3 ,hB =+

tenemos que

3 A2

1−+= kh y 3 B .

2

1−−= kh

Ahora bien, arriba hemos encontrado que

,2

31 −+−=m ;2

31 −−−=n

por eso, al multiplicar estas cantidades conjuntamente, tenemos que

3 Am 3 Bn+2

3kh+−=

y que

3 An 3 Bm+ ,2

3kh−−=

que son cantidades reales. Consecuentemente, si la raíz h es real, las otras dos raíces

también serán reales en el caso irreducible, y lo serán solamente en ese caso.

Pero la dificultad invariable es demostrar directamente que

,11 33 −−+−+ gfgf

que hemos supuesto igual a h, sea siempre una cantidad real, sean cuales sean los

valores de f y g. En algunos casos particulares, la demostración puede efectuarse por la

extracción de la raíz cúbica, cuando esto último es posible. Por ejemplo, si

,11,2 == gf encontraremos que la raíz cúbica de 1112 −+ será 12 −+ , y que,

similarmente, la raíz cúbica de 1112 −− será 12 −− , y que la suma de los radicales

será 4. Se puede construir un número infinito de ejemplos de esta clase, y fue a partir de

la consideración de tales casos, que Bombelli se convenció de la realidad de la

expresión imaginaria en la fórmula para el caso irreductible. Pero aún cuando la

extracción de raíces cúbicas es - en general - posible solamente por medio de las series,

50

no podemos llegar, por esta forma, a una demostración general y directa de la

proposición que estamos considerando.

Sucede de otra manera con las raíces cuadradas y con todas las raíces cuyos

exponentes sean potencias de 2. Por ejemplo, si tenemos la expresión

,11 −−+−+ gfgf

compuesta de dos radicales imaginarios, su cuadrado será

,22 22 gff ++

una cantidad necesariamente positiva. Extrayendo la raíz cuadrada, para obtener la

expresión equivalente, tenemos

,22 22 gff ++

para el valor real de la cantidad imaginaria con la que empezamos. Pero si en lugar de la

suma tuviéramos la diferencia entre los dos radicales imaginarios propuestos,

hubiéramos tenido, para su cuadrado, la siguiente expresión

,22 22 gff +−

una cantidad necesariamente negativa; y, tomando la raíz cuadrada de esta última,

habremos obtenido la simple expresión imaginaria

.22 22 gff +−

Además, si la cantidad

44 11 −−+−+ gfgf

nos fuese dada, tendríamos, al elevar al cuadrado, la forma

,222211 4 22224 22 gfgffgfgfgf ++++=++−−+−+

una cantidad real y positiva. Extrayendo la raíz cuadrada de esta expresión, debemos

obtener un valor real para la cantidad original; y así sucesivamente para todas las otras

raíces pares restantes. Pero si queremos aplicar el método precedente a radicales

cúbicos, llegaríamos de nuevo a ecuaciones de tercer grado en el caso irreductible.

Por ejemplo, sea

.11 33 xgfgf =−−+−+

Elevando al cubo, tenemos

( ) ;1132 3333 22 xgfgfgff =−−+−+++

esto es

51

,32 33 22 xgfxf =++

o, con los términos propiamente arreglados (acomodados),

,023 3 223 =−+− fgfxx

la fórmula general del caso irreductible, porque

( ) .327

1)2(

4

1 23

3 222 ggff −=+−+

Si 0=g , debemos tener que .23 fx = El único desiderátum‡‡ , por lo tanto, es

demostrar que si g tiene cualquier valor, x tiene un valor real correspondiente. Luego, la

segunda última ecuación§§ da

x

fxgf

3

233 22 −=+

y elevando al cubo obtenemos

,27

81263

3236922

x

ffxfxxgf

−+−=+

y en donde

,27

81563

323692

x

ffxfxxg

−−−=

una ecuación que puede ser escrita como sigue

( )( ),

27

83

2332

x

fxfxg

+−=

o, mejor, así

( ) .8

127

1 233

2 fxx

fg +

−=

Es evidente, a partir de la última expresión, que g es cero cuando fx 83 = ; y,

además, que g incrementa constante e ininterrumpidamente a medida que x incrementa;

porque el factor ( )23 fx + aumenta constantemente, y el otro factor 3

81

x

f− también

sigue aumentando, y podemos observar que, mientras el denominador 3x se incrementa,

la parte negativa 3

8

x

f, que es originalmente igual a 1, crece constantemente menos que

‡‡ Deseo, anhelo, que Lagrange demostrará a continuación. Nota del Traductor. §§ Lagrange se refiere a la ecuación ,32 33 22 xgfxf =++ que es la que utilizará para demostrar

este último punto. Nota del Traductor.

52

1. Por lo tanto, si el valor de 3x se incrementa por grados insensibles desde f8 al

infinito, el valor de 2g también aumentará por grados insensibles y correspondientes

desde cero al infinito. Y, por consiguiente, a cada valor de 2g desde cero al infinito

corresponde, recíprocamente, algún valor de 3x que yace entre los límites de f8 y el

infinito, y como esto es así sin importar cuál sea el valor de f , podemos legítimamente

concluir que, sean los valores de f y g los que sean, el valor correspondiente de 3x - y,

por lo tanto, también de x - será siempre real.

¿Pero cómo debe ser asignado este valor de x? Parecería que puede ser

representado solamente por una expresión imaginaria o por una serie que sea el

desarrollo de una expresión imaginaria. Vamos a considerar a esta clase de expresiones

imaginarias, que corresponde a los valores reales, como constituyente de una nueva

especie de expresiones algebraicas y, aunque éstas no sean, como otras expresiones,

susceptibles de ser numéricamente evaluadas en la forma en la que existen, poseen la

indiscutible ventaja - y este es el principal requisito - de que pueden ser empleadas en

las operaciones del álgebra exactamente como si no contuvieran expresiones

imaginarias. Además tienen la ventaja de ser sumamente útiles en las construcciones

geométricas, como veremos en la teoría de las secciones angulares, de forma tal que

siempre pueden ser exactamente representadas por líneas; en cuanto a su valor

numérico, siempre podemos encontrarlo de manera aproximada y en cualquier grado de

exactitud que queramos, ya sea por la resolución aproximada de la ecuación de la que

dependan, o por el uso de simples tablas trigonométricas.

En la geometría, está demostrado que si en un círculo que tenga un radio r, se

toma un arco cuya cuerda sea c, y que si la cuerda de la tercera parte de ese arco es x,

tendremos, para la determinación de x, la siguiente ecuación de tercer grado

,03 223 =+− crxrx

una ecuación que nos conduce al caso irreducible, porque c es siempre necesariamente

menor que 2r, y que, debido a las dos cantidades indeterminadas r y c, puede ser tomada

como el tipo de todas las ecuaciones de esta clase. Porque, si la comparamos con la

ecuación general

,03 =++ qpxx

tendremos

53

3

pr −= y

p

qc

3−=

de manera que, al hacer la trisección del arco correspondiente a la cuerda c en un círculo

del radio r, debemos obtener, en seguida, el valor de una raíz x, que será la cuerda de la

tercera parte de ese arco. Ahora bien, debido a la naturaleza de un círculo, la misma

cuerda c corresponde no solamente al arco s sino (llamando a la circunferencia entera u)

también a los arcos

,su − ,2 su + ,...3 su −

También los arcos

,su + ,2 su − ,...3 su +

tienen la misma cuerda, pero tomada negativamente, porque al completar una

circunferencia entera, las cuerdas se vuelven cero y después negativas, y no se vuelven

positivas otra vez hasta completar la segunda circunferencia, como ustedes pueden ver

fácilmente. Por consiguiente, los valores de x no son solamente la cuerda del arco ,3

s

sino también las cuerdas de los arcos

,3

su − ,

3

2 su +

y estas cuerdas serán las tres raíces de la ecuación propuesta. Si tomáramos los arcos

sucesivos que tienen la misma cuerda c, simplemente llegaríamos a las mismas raíces,

porque el arco su −3 daría la cuerda de ,3

3 su − esto es, de ,

3

su − que, como ya hemos

visto, es la misma que la de ,3

s y así con el resto.

Como en el caso irreductible el coeficiente p es necesariamente negativo, el

valor de la cuerda dada c será positivo o negativo dependiendo de si q es positiva o

negativa. En el primer caso, tomamos por s el arco subtendido por la cuerda positiva

.3

p

qc −= El segundo caso es reducible del primero al hacer a x negativa, por lo cual el

signo del último término es cambiado; de manera que, si tomamos de nuevo para s un

arco subtendido por la cuerda positiva ,3

p

q simplemente tenemos que cambiar el signo

de las tres raíces.

54

Aunque la discusión precedente pueda ser suficiente para disipar todas las dudas

concernientes a la naturaleza de las raíces de las ecuaciones de tercer grado, vamos a

añadir algunas reflexiones referentes al método por el cual las raíces son encontradas. El

método que hemos propuesto en lo precedente y que es conocido comúnmente como el

método de Cardano, aunque a mí me parece que se lo debemos a Hudde, ha sido

frecuentemente criticado, y sin duda seremos siempre criticados, porque damos a las

raíces, en el caso irreductible, una forma imaginaria, simplemente porque aquí se hace

una suposición que es contradictoria a la naturaleza de la ecuación. Porque la esencia

del método consiste en que supone la cantidad desconocida igual a dos cantidades

indeterminadas zy + , de manera que después podamos separar la ecuación resultante

( )( ) 0333 =+++++ qzypyzzy

en lo siguiente:

03 =+ pyz y .033 =++ qzy

Ahora, convirtiendo la primera de estas ecuaciones en la forma

27

333 p

zy −=

resulta evidente que la cuestión se reduce a encontrar dos números 3y y 3z cuya suma

sea q− , y cuyo producto sea ,27

3p− lo que es imposible, a menos que el cuadrado de la

mitad de la suma exceda al producto, porque la diferencia entre estas dos cantidades es

igual al cuadrado de la mitad de la diferencia de los números buscados.

La conclusión natural fue que no eran tan sorprendente el que llegáramos a

expresiones imaginarias al proceder desde una suposición imposible de expresar en

números, y, debido a esto, algunos escritores se han visto inducidos a creer que, al

adoptar un rumbo diferente, la expresión en cuestión lograría ser evitada, y que las

raíces podrían ser obtenidas en su forma real.

Debido a que más o menos se puede hacer la misma objeción a los otros

métodos que desde entonces han sido encontrados, y a que todos, de igual forma, se

basan en el método de los indeterminados, esto es, en la introducción de ciertas

cantidades arbitrarias a ser determinadas para satisfacer las condiciones del problema,

proponemos considerar la cuestión de la realidad de las raíces por sí mismas,

independientemente de cualquier suposición. Tomemos de nuevo la ecuación

;03 =++ qpxx

55

y supongamos que sus tres raíces son a, b, c.

Por la teoría de las ecuaciones, la parte izquierda de la expresión precedente es el

producto de tres cantidades

,ax − ,bx− ,cx−

que, multiplicadas conjuntamente, dan

;)()( 23 abcxbcacabxcbax −+++++−

y, comparando los términos correspondientes, tenemos

,0=++ cba ,pbcacab =++ .qabc −=

Como el grado de la ecuación es impar, podemos estar seguros, como sin duda ustedes

ya saben, y en cualquier caso veremos claramente esto en la lección que sigue, que

necesariamente tiene una raíz real. Sea esa raíz c. La primera de las tres ecuaciones que

recién encontramos será, entonces

,bac −−=

de donde resulta obvio que ba + es también necesariamente una cantidad real.

Sustituyendo el último valor de c en la segunda y tercera ecuaciones, tenemos que

,22 pbababaab =−−−− ,)( qbaab −=+−

ó

,22 pbaba −=++ ,)( qbaab =+

a partir de lo cual a y b tienen que ser encontradas. La última ecuación da ,ba

qab

+=

por lo cual concluyo queabes también necesariamente una cantidad real. Consideremos

ahora la cantidad ,274

32 pq + o, eliminando las fracciones, la cantidad ,427 32 pq + sobre

cuyo signo depende el caso irreducible. Sustituyendo en esto, por p y q, su valor como

dado arriba en términos de a y b, encontramos que, cuando han sido hechas las

reducciones necesarias, la cantidad en cuestión es igual al cuadrado de

2233 3322 abbaba −+−

tomada negativamente; de manera que, al cambiar los signos y extraer la raíz cuadrada,

tenemos

,4273322 322233 pqabbaba −−=−+−

de donde es fácil inferir que las dos raíces a y b no pueden ser reales a menos que la

cantidad 32 427 pq + sea negativa. Pero demostraré que, en tal caso, que es, como

56

sabemos, el caso irreductible, las dos raíces a y b son necesariamente reales. La

cantidad

2233 3322 abbaba −+−

puede ser reducida a la forma

),522)(( 22 abbaba ++−

como la multiplicación lo puede demostrar. Ahora bien, ya hemos visto que las dos

cantidades ba + y ab son necesariamente reales, de donde se sigue que

abbaabba ++=++ 222 )(2522

es también necesariamente real. Por lo tanto, el otro factor ba − es también real cuando

el radical 32 427 pq −− es real. Entonces, al ser ba + y ba − cantidades reales,

también lo son a y b.

Ya hemos derivado los teoremas precedentes de la forma de las raíces en sí

mismas. Pero la demostración presente es, en algunos aspectos, más general y más

directa, y es deducida de los principios fundamentales del problema en sí mismo. No

hemos hecho suposición alguna, y la naturaleza particular del caso irreductible carece

de cantidades imaginarias.

Pero los valores de a y b todavía tienen que ser encontrados a partir de las

ecuaciones precedentes. Y para este fin, observo que la parte izquierda de la ecuación

( ) 322233 4272

1

2

3pqabbaba −−=−+−

puede ser hecha un cubo perfecto al añadir la parte izquierda de la ecuación

,)( qbaab =+

multiplicada por ,2

33 − y que la raíz de este cubo es

ab2

31

2

31 −+−−−

de manera que, extrayendo la raíz cúbica de ambos lados, tendremos la expresión

ab2

31

2

31 −+−−−

expresada en cantidades conocidas. Y como el radical 3− puede también ser

considerado en su forma negativa, también tendremos la expresión

ab2

31

2

31 −−−−+

57

expresada en cantidades conocidas, y a partir de la cual los valores de a y b pueden ser

deducidos. Y estos valores contendrán la cantidad imaginaria 3− , que fue introducida

por multiplicación, y serán reducibles a la misma forma con las dos raíces

33 BnAm + y 33 BmAn +

que encontramos arriba. La tercera raíz

bac −−=

será entonces expresada por .33 BA +

Por este método, vemos que las cantidades imaginarias empleadas han

simplemente servido para facilitar la extracción de la raíz cúbica sin la cual nos hubiera

resultado imposible determinar por separado los valores de a y b. Y como

aparentemente es imposible alcanzar este objetivo por un método diferente, podemos

considerar al método que empleamos como una verdad demostrada de que la expresión

general de las raíces de una ecuación de tercer grado en el caso irreductible, no puede

hacerse independiente de cantidades imaginarias.

Pasemos ahora a las ecuaciones de cuarto grado. Ya hemos dicho que el

artificio empleado originalmente para resolver estas ecuaciones consistía en arreglarlas

(acomodarlas) de tal manera que la raíz cuadrada de los dos lados pudiera ser extraída, y

por lo cual eran reducidas a ecuaciones de segundo grado. Lo que sigue es un ejemplo

del procedimiento empleado. Sea

024 =+++ rqxpxx

la ecuación general de cuarto grado privada de su segundo término, que siempre puede

ser eliminado, como ustedes saben, al incrementar o disminuir las raíces por una

cantidad adecuada. Sea la ecuación puesta en la forma

,24 rqxpxx −−−=

y en cada lado sean añadidos los términos 222 yyx + , que contienen una nueva cantidad

indeterminada y, pero que aún así permiten que la parte izquierda de la ecuación

continúe siendo un cuadrado. Tendremos entonces

( ) ( ) .2 2222 ryqxxpyyx −+−−=+

Ahora debemos hacer que la parte derecha sea también un cuadrado. Para este fin, es

necesario que

( )( ) ,24 22 qrypy =−−

en cuyo caso la raíz cuadrada de la parte derecha tendrá la forma

58

.22

2py

qpyx

−−−

Suponiendo entonces que la cantidad y satisface la ecuación

( )( ) ,24 22 qrypy =−−

que desarrollada se convierte en

,0822

223 =−+−− qpr

rypy

y

y que, como podemos ver, es una ecuación de tercer grado; de esta manera, la ecuación

originalmente dada puede ser reducida a los siguiente al extraer la raíz cuadrada de sus

dos miembros, a saber:

,22

22

py

qpyxyx

−−−=+

donde podemos tomar cualquiera de los dos valores para el radical ,2 py − y

consecuentemente tendremos dos ecuaciones de segundo grado - a las que la ecuación

dada ha sido reducida -, y cuyas raíces nos darán las cuatro raíces de la ecuación

original.

Todo esto nos proporciona el primer caso de la descomposición de ecuaciones en otras

de menor grado.

El método de DESCARTES, que es comúnmente el seguido al estudiar los

elementos del álgebra, está basado en la misma idea, y consiste en asumir el principio

de que la ecuación propuesta es producida por la multiplicación de dos ecuaciones de

segundo grado, como

02 =+− suxx y ,02 =++ tuxx

donde u, s, y t son coeficientes indeterminados. Multiplicándolos conjuntamente,

tenemos

( ) ( ) ,024 =+−+−++ stuxtsxutsx

comparando esto con la ecuación original, tenemos

,2 puts =−+ ,)( quts =− .rst =

Las primeras dos ecuaciones dan

,2 2

u

qups ++= .2 2

u

qupt −+=

Y si estos valores son sustituidos en la tercera ecuación de condición rst = , tendremos

una ecuación de sexto grado en u, y que, debido a que contiene únicamente potencias

59

pares de u, es resoluble por las reglas para las ecuaciones cúbicas. Y si sustituimos en

esta ecuación py −2 por 2u , tendremos en y la misma ecuación reducida que

encontramos arriba gracias al viejo método.

Al tener el valor de 2u , tenemos también los valores de s y t, y nuestra ecuación

de cuarto grado será descompuesta en dos ecuaciones de segundo grado que nos darán

las cuatro raíces buscadas. Este método, así como el precedente, ha dado ocasión a

cierta indecisión acerca de cuál de las tres raíces de la ecuación cúbica reducida en 2u ó

y debe emplearse. La dificultad ha sido bien resuelta en el Algebra de Clairaut, en donde

podemos ver que siempre obtenemos las mismas cuatro raíces o valores de x sin

importar cuál raíz de la ecuación reducida empleemos. Pero esta generalidad es

innecesaria y perjudicial a la simplicidad deseable en la expresión de las raíces de la

ecuación propuesta, y debemos preferir las fórmulas que ustedes han estudiado en el

curso principal y en las que las tres raíces de la ecuación reducida están contenidas

exactamente en la misma manera.

Lo que sigue es otro método para alcanzar las mismas fórmulas, menos directo

que el que ya ha sido expuesto a ustedes, pero que tiene la ventaja de ser análogo al

método de Cardano para las ecuaciones de tercer grado.

Tomo de nuevo la ecuación

,024 =+++ rqxpxx

y suponemos que

.tzyx ++=

Elevando al cuadrado, obtenemos

).(22222 ztytyztzyx +++++=

Elevando otra vez al cuadrado, tenemos

( ) ( )( ) ( ) ;44 222222224 ztytyzztytyztzytzyx ++++++++++=

pero

( ) ).(2222 2222222222222222 tzyyzttztyzyyzttyzztytztyzyztytyz +++++=+++++=++

Sustituyendo estos tres valores de ,x ,2x y 4x en la ecuación original, y reuniendo los

términos multiplicados por tzy ++ y los términos multiplicados por ,ztytyz ++

tenemos la ecuación transformada

60

( ) ( ) ( )[ ]( )++++++++++++ ztytyzptzytzyptzy 24 2222222222

( ) ( )( ) .084 222222 =+++++++ rtzyqyzttztyzy

Ahora procedemos como lo hicimos con las ecuaciones de tercer grado, donde hicimos

que los términos que contenían zy + desaparecieran, y, de la misma forma, aquí

haremos que los términos que contengan tzy ++ , e ztytyz ++ desaparezcan, lo que

nos dará las dos ecuaciones de condición

08 =+ qyzt y ( ) .024 222 =+++ ptzy

Queda la ecuación

( ) ( ) ( ) ;04 2222222222222 =+++++++++ rtztyzytzyptzy

y las tres conjuntamente determinarán las cantidades y, z, y t. La segunda da de

inmediato

,2

222 ptzy −=++

que, sustituida en la tercera, produce

.416

2222222 rp

tztyzy −=++

La primera, elevada al cuadrado, da

.64

2222 q

tzy =

Por lo tanto, a partir de la teoría general de las ecuaciones, las tres cantidades ,2y ,2z

2t serán las raíces de una ecuación de tercer grado que tiene la forma

;0644162

2223 =−

−++ q

urp

up

u

de manera que, si a las tres raíces de esta ecuación, que llamaremos la ecuación

reducida, las designamos por a, b, y c, tendremos

ay = , ,bz = ,ct =

y el valor de x será expresado por

.cba ++

Debido a que cada uno de los tres radicales puede tomar el signo positivo o el negativo,

debemos tener, si son hechas todas las combinaciones posibles, ocho diferentes valores

para x. Debe observarse, sin embargo, que en el análisis precedente empleamos la

61

ecuación 64

2222 q

tzy = , mientras que la ecuación inmediatamente dada es .8

qyzt −= Por

lo tanto, el producto de las tres cantidades y, z, t, esto es, de los tres radicales

,a ,b c

debe tener el signo contrario al de la cantidad q. Entonces, si q es una cantidad negativa,

deben estar contenidos en la expresión para x o tres radicales positivos, o bien uno

positivo y dos negativos. Y en este caso tendremos únicamente las siguientes cuatro

combinaciones:

cba ++ , ,cba −−

,cba −+− ,cba +−−

y que serán las cuatro raíces de la ecuación de cuarto grado propuesta. Pero si q es una

cantidad positiva, deben estar contenidos en la expresión para x o tres radicales

negativos, o bien uno negativo y dos positivos, lo que nos dará las otras siguientes

cuatro combinaciones como las raíces de la ecuación propuesta:***

,cba −−− ,cba ++−

,cba +− .cba −+

Ahora bien, si las tres raíces a, b, c de la ecuación reducida de tercer grado son todas

reales y positivas, entonces es evidente que las cuatro raíces precedentes también serán

todas reales. Pero si entre las tres raíces reales a, b, c, cualesquiera son negativas,

entonces obviamente las cuatro raíces de la ecuación bicuadrada dada serán imaginarias.

Por esto, además de la condición para la realidad de las tres raíces de la ecuación

reducida, es también un requisito, de acuerdo con la bien conocida regla de

DESCARTES, que los coeficientes de los términos de la ecuación reducida sean

alternativamente positivos y negativos, y, consecuentemente, que p sea negativa y

*** Estas simples y elegantes fórmulas se deben a Euler. Pero M. Bret, profesor de matemáticas en Grenoble, ha hecho la importante observación (véase la Correspondance sur l’ Ecole Polytechnique, t. II, 3me Cahier, p. 217) de que pueden dar valores falsos cuando se utilizan cantidades imaginarias entre las cuatro raíces. Para eliminar cualquier dificultad y ambigüedad, simplemente tenemos que sustituir, por uno de

estos radicales, su valor como derivado de la ecuación .8

qcba −= Entonces la fórmula

ba

qba

8−+

dará las cuatro raíces de la ecuación original al tomar por a y b cualesquiera dos de las tres raíces de la ecuación reducida, y al tomar los dos radicales sucesivamente positivos y negativos. La observación precedente debe ser añadida al artículo 777 del Algebra de Euler y al artículo 37 de la Nota XIII del autor en el Traité de la résolution des équations numériques.

62

416

2 rp − positiva, esto es, p2>4r. Si una de estas condiciones no se cumple, la ecuación

bicuadrada propuesta no puede tener cuatro raíces reales. Si la ecuación reducida tiene

una sola raíz real, se verá, primero, que por razón de su último término siendo negativo,

la sola raíz real de la ecuación debe necesariamente ser positiva. Entonces es fácil ver a

partir de las expresiones generales que dimos para las raíces de ecuaciones cúbicas

privadas de su segundo término - una forma a la cual la ecuación reducida en u puede

ser fácilmente llevada al simplemente incrementar todas las raíces por la cantidad 6

p -,

es fácil ver, decía, que las dos raíces imaginarias de esta ecuación serán de la forma

1−+ gf y 1−− gf .

Por consiguiente, suponiendo que a sea la raíz real y b, c las dos raíces imaginarias, a

será una cantidad real y cb + también será real por las razones que dimos arriba;

mientras que, por el otro lado, cb − será imaginaria. De esto se sigue que de las

cuatro raíces de la ecuación bicuadrada propuesta, las dos primeras serán reales y las

otras dos serán imaginarias.

En cuanto al resto, si hacemos que 6

psu −= en la ecuación reducida en u, con

el fin de eliminar el segundo término y de reducirla a la forma que acabamos de

examinar arriba, debemos tener la siguiente ecuación transformada en s:

;06424864448

2323 =−+−

+− qprp

srp

s

y la condición para la realidad de las tres raíces de la ecuación reducida será

32

4484

+ rp

> .6424864

27223

+− qprp

63

LECCIÓN IV

SOBRE LA RESOLUCIÓN DE ECUACIONES NUMÉRICAS

Hemos visto cómo pueden resolverse ecuaciones de segundo, tercer, y cuarto grado. Las

ecuaciones de quinto grado constituyen una especie de barrera para los analistas, que

nunca han podido superar, incluso con grandes esfuerzos. La resolución general de este

tipo de ecuaciones es una de las cosas más deseables en el álgebra. Y digo en el álgebra,

porque si con las ecuaciones de tercer grado la expresión analítica de las raíces resulta

insuficiente para determinar, en todos los casos, su valor numérico, a fortiori debe

suceder lo mismo con las ecuaciones de mayor grado. Y de esta manera nos

encontramos constantemente bajo la necesidad de tener algún recurso a otros medios

para poder determinar numéricamente las raíces de una ecuación dada, porque el

determinar estas raíces es, en última instancia, el objetivo de la solución de todos los

problemas que ofrecen la necesidad o la curiosidad.

Me propongo establecer aquí los principales artificios que han sido ideados para

lograr este importante objetivo. Consideremos cualquier ecuación de grado m,

representada por la fórmula

,0...321 =+++++ −−− urxqxpxx mmmm

en donde x es la cantidad desconocida, p, q, r,…los coeficientes conocidos positivos o

negativos, y u el último término, que no contiene a x, y consecuentemente es también

una cantidad conocida. Se asume que los valores de estos coeficientes son dados o en

números o en líneas (esto es indiferente, ya que al tomar una línea dada como la unidad

o medida común del resto, podemos también asignar valores numéricos a todas las

líneas); y es claro que esta asunción es siempre permisible cuando la ecuación es el

resultado de un problema real y determinado. El problema es encontrar el valor, o, si

hay varios, los valores de x que satisfagan la ecuación, es decir, que hagan que la suma

de todos sus términos sea cero. Ahora bien, cualquier otro valor que pueda ser dado a x

hará esa suma igual a alguna cantidad positiva o negativa, y esto es porque solamente

potencias enteras de x entran en la ecuación, y, por lo tanto, es obvio que cada valor real

de x también dará un valor real para la cantidad en cuestión. Entre más se acerque ese

valor a cero, más se acercará el valor de x - que lo ha producido - a una raíz de la

64

ecuación. Y si encontramos dos valores de x, en donde uno de los cuales haga la suma

de los términos igual a una cantidad positiva, y el otro a una cantidad negativa, podemos

estar seguros de que entre estos dos valores habrá, por necesidad, por lo menos un valor

que hará que la expresión sea cero, y consecuentemente será una raíz de la ecuación.

Sea P la suma de todos los términos de la ecuación con el signo +, y Q la suma

de todos los términos con el signo .− Entonces la ecuación será representada por

.0=− QP

Supongamos, para simplificar aún más, que los dos valores de x en cuestión son

positivos, que A es el más pequeño, B el mayor, y que la sustitución de A por x da un

resultado negativo, y que la sustitución de B por x un resultado positivo; esto es, que el

valor de QP − es negativo cuando Ax = , y positivo cuando .Bx =

Consecuentemente, cuando Ax = , P será menor que Q, y cuando Bx = , P será

mayor que Q. Ahora bien, debido a la forma de las cantidades P y Q, que contienen

solamente términos positivos y potencias enteras positivas de x, es claro que estas

cantidades aumentan continuamente a medida que x aumenta, y que al hacer que x

aumente en grados insensibles a lo largo de todos los valores desde A a B, ellas también

aumentarán en grados insensibles pero de tal forma que P siempre crecerá más que Q,

viendo que, al haber sido menor a Q, se ha convertido en mayor. Por lo tanto,

necesariamente debe haber alguna expresión para el valor de x entre A y B que haga que

P = Q; así como dos cuerpos en movimiento que, suponiendo han viajado a lo largo de

la misma línea recta, y que, habiendo empezado simultáneamente desde dos puntos

diferentes, llegan simultáneamente a otros dos puntos, pero de tal forma que el cuerpo

que al principio estaba por detrás está ahora por delante del otro; así como dos cuerpos,

decía, deben necesariamente encontrarse en algún punto de su camino. Ese valor de x,

por lo tanto, que hará que P = Q, será una de las raíces de la ecuación, y tal valor estará

necesariamente entre A y B.

El mismo razonamiento puede emplearse para los otros casos, y siempre con el

mismo resultado.

La proposición en cuestión es también demostrable a partir de una consideración

directa de la ecuación por sí misma, que puede ser pensada como compuesta del

producto de los factores

,ax − ,bx − ,...,cx −

65

donde a, b, c,…son las raíces. Porque es obvio que este producto no puede, por la

sustitución de dos valores diferentes de x, hacer que cambie su signo, a menos que por

lo menos uno de los factores cambie su signo. Y es igualmente fácil ver que si más de

uno de los factores cambia su signo, su número será impar. Así, si A y B son dos valores

de x para que el factor bx − , por ejemplo, tenga signos opuestos, entonces si A es

mayor que b, necesariamente B debe ser menor que b, o viceversa. Entonces,

forzosamente, la raíz b se encontrará entre las dos cantidades A y B.

En cuanto a las raíces imaginarias, - si es que hay alguna en la ecuación - debido

a que se ha demostrado que siempre aparecen en pares y son de la forma

,1−+ gf ,1−− gf

por lo tanto, si a y b son imaginarias, el producto de los factores ax− y bx− será

( )( ) ( ) ,11 22 gfxgfxgfx +−=−+−−−−

una cantidad siempre positiva sea cual sea el valor dado a x. De esto se sigue que las

alternancias en el signo pueden deberse sólo a las raíces reales. Pero como el teorema

respectivo a la forma de las raíces imaginarias no puede ser rigurosamente demostrado

sin recurrir al otro teorema (el de que cada ecuación de un grado impar tiene

necesariamente una raíz real, un teorema cuya demostración general depende de la

proposición que nos ocupa probar), se sigue que la demostración debe ser considerada

como una especie de círculo vicioso, y que debe ser reemplazada por otra menos

expugnable.

Pero existe un método más general y sencillo para considerar ecuaciones, y que

tiene la ventaja de proporcionar una demostración directa de las principales propiedades

de las ecuaciones. Se basa en una especie de aplicación de la geometría al álgebra, y es

la más digna de exposición debido a su extenso uso en todas las ramas de las

matemáticas.

Tomemos de nuevo la ecuación general propuesta arriba, y representemos por

líneas rectas todos los valores sucesivos que son dados a la cantidad desconocida x, y

hagamos lo mismo para los valores correspondientes que, de esta manera, asume la

parte izquierda de la ecuación. Para este fin, en lugar de suponer que la parte derecha de

la ecuación es igual a cero, la supondremos igual a una cantidad indeterminada y.

Ponemos los valores de x sobre una línea recta indefinida AB (Fig. 1), empezando desde

un punto fijo 0, en el cual x es cero, y tomamos los valores positivos de x en la dirección

0B a la derecha de 0, y los valores negativos de x en la dirección opuesta, esto es, a la

66

izquierda de 0. Sea 0P cualquier valor de x. Para representar el valor correspondiente de

y, erigimos en P una perpendicular a la línea 0B y ponemos en ella el valor de y en la

dirección PQ, por encima de la línea recta 0B si es positiva, y en la misma perpendicular

por debajo de 0B si es negativa.

Fig. 1

Hacemos lo mismo para todos los valores de x, ya sean positivos o negativos; esto es,

ponemos valores correspondientes de y sobre perpendiculares a la línea recta a lo largo

de todos los puntos cuya distancia desde el punto 0 sea igual a x. Las extremidades††† de

todas estas perpendiculares formarán juntas una línea recta o una curva, que

proporcionará, por decirlo de alguna manera, una imagen de la ecuación

....21 yuqxpxx mmm =++++ −−

La línea AB es llamada el eje de la curva, 0 el origen de las abscisas, 0P = x una abscisa,

PQ = y la ordenada correspondiente, y las ecuaciones en x e y las ecuaciones de la

curva. Dada una curva como la que ha sido descrita en la Fig. 1, es obvio que sus

intersecciones con el eje AB darán las raíces de la ecuación propuesta

.0...21 =++++ −− uqxpxx mmm

Al ver que esta ecuación se realiza únicamente cuando en la ecuación de la curva y se

vuelve cero, los valores de x que satisfacen la ecuación en cuestión y que son sus raíces

††† Es decir, si tomamos como ejemplo la perpendicular PQ, los puntos equivalentes a Q. Nota del Traductor.

67

solamente pueden ser las abscisas que corresponden a los puntos en donde las ordenadas

son cero, esto es, a los puntos en donde la curva corta el eje AB. Así, suponiendo que la

curva de la ecuación en x y en y es la representada en la Fig. 1, las raíces de la ecuación

propuesta serán

0M, 0N, 0R,…y ,0I− ,...0G−

Doy el signo de menos a los últimos porque las intersecciones I, G,…están del otro lado

del punto 0. La consideración de la curva en cuestión da lugar a las siguientes

observaciones generales sobre las ecuaciones:

(1) Debido a que la ecuación de la curva contiene solamente potencias enteras y

positivas de la cantidad desconocida x, es obvio que a cada valor de x debe corresponder

un valor determinado de y, y que el valor en cuestión será único y finito mientras x sea

finita. Pero como no existe nada que limite los valores de x, éstos pueden ser supuestos

como infinitamente grandes - ya sea positivos o negativos - y a ellos corresponderán

valores de y que también serán infinitamente grandes. De donde se sigue que la curva

tendrá un curso único y continuo, y que puede ser extendida al infinito en ambos lados

del origen 0.

(2) También se sigue de esto que la curva no puede pasar de un lado del eje al

otro sin cortarlo, y que no puede regresar al mismo lado sin haberlo cortado dos veces.

Consecuentemente, entre cualesquiera dos puntos de la curva en el mismo lado del eje,

habrá necesariamente o ninguna intersección, o un número par de intersecciones; por

ejemplo, entre los puntos H y Q encontramos dos intersecciones I y M, y entre los

puntos H y S encontramos cuatro, I, M, N, R, etc. Por el contrario, entre un punto en un

lado del eje y un punto en el otro lado, la curva tendrá un número impar de

intersecciones; por ejemplo, entre los puntos L y Q hay una intersección M, y entre los

puntos H y K hay tres intersecciones, I, M, N, etc.

Por la misma razón, no puede haber una simple intersección, a menos que, a

ambos lados del punto de intersección - arriba y abajo del eje - los puntos de la curva

estén situados como lo están los puntos L, Q con respecto a la intersección M. Pero dos

intersecciones, tales como N y R, pueden aproximarse entre sí para, al final coincidir en

T. Entonces la ramificación QKS tomará la forma de la línea punteada QTS y tocará al

eje en T, y consecuentemente yacerá en toda su extensión por encima del eje; este es el

caso en el que las dos raíces 0N, 0R son iguales. Si tres intersecciones coinciden en un

punto - una coincidencia que ocurre cuando hay tres raíces iguales -, entonces la curva

68

cortará el eje solamente en un punto adicional, como en el caso de un único punto de

intersección, y así sucesivamente.

Consecuentemente, si hemos encontrado dos valores para y que tengan el mismo

signo, podemos estar seguros que entre los dos valores correspondientes de x solamente

puede haber un número par de raíces de la ecuación propuesta; esto es, que no habrá

ninguna, o que habrá dos, o cuatro, etc. Por otro lado, si hemos encontrado para y dos

valores que tengan signos contrarios, podemos estar seguros que entre los valores

correspondientes de x necesariamente habrá un número impar de raíces de la ecuación

propuesta; esto es, que habrá una, o habrá tres, o cinco, etc.; de modo que, para el caso

ahora mencionado, podemos inferir inmediatamente que habrá, por lo menos, una raíz

entre los dos valores de x para la ecuación propuesta.

A la inversa, cada valor de x que sea una raíz de la ecuación se encontrará entre

algún valor mayor y otro menor de x y que, al ser sustituido por x en la ecuación, dará

valores de y con signos contrarios.

Sin embargo, si el valor de x es una raíz doble, este no será el caso; esto es, si la

ecuación contiene dos raíces del mismo valor. Por otra parte, si el valor de x es una raíz

triple, de nuevo existirán un valor mayor y uno menor de x que dará signos contrarios a

los valores correspondientes de y, y así con el resto.

Si ahora consideramos la ecuación de la curva, es obvio, en primer lugar, que al

hacer que 0=x debemos tener ;uy = y, consecuentemente, que el signo de la ordenada

y será el mismo que el de la cantidad u, el último término de la ecuación propuesta.

También es fácil ver que se puede dar a x un valor positivo o negativo lo

suficientemente grande como para hacer que el primer término mx de la ecuación

exceda la suma de todos los otros términos que tienen el signo opuesto a ;mx con el

resultado de que el valor correspondiente de y tendrá el mismo signo que el primer

término .mx Ahora bien, si m es impar, mx será positiva o negativa dependiendo de si x

es positiva o negativa, y si m es par, mx será siempre positiva, independientemente de si

x es positiva o no. De esto podemos concluir lo siguiente:

(1) Que cada ecuación de un grado impar cuyo último término sea negativo,

tiene un número impar de raíces entre 0=x y algún valor positivo muy grande de x, y

un número par de raíces entre 0=x y algún valor negativo muy grande de x, y,

consecuentemente, que tiene, por lo menos, una raíz real positiva. Y que,

contrariamente, si el último término de la ecuación es positivo, tendrá un número impar

69

de raíces entre 0=x y algún valor negativo muy grande de x, y un número par de raíces

entre 0=x y algún valor positivo muy grande de x, y, consecuentemente, que tiene, por

lo menos, una raíz real negativa.

(2) Que cada ecuación de un grado par cuyo último término sea negativo, tiene

un número impar de raíces entre 0=x y algún valor positivo muy grande de x, así

como también un número impar de raíces entre 0=x y algún valor negativo muy

grande de x, y, consecuentemente, tendrá, por lo menos, una raíz real positiva y una raíz

real negativa. Y que, por otro lado, si el último término es positivo, habrá un número

par de raíces entre 0=x y algún valor positivo muy grande de x, y también un número

par de raíces entre 0=x y algún valor negativo muy grande de x; con el resultado de

que, en este caso, la ecuación podría no tener alguna raíz real, ya sea positiva o

negativa.

Hemos dicho que siempre se le puede dar a x un valor lo suficientemente grande

como para hacer que el primer término mx de la ecuación exceda la suma de todos los

términos de signo contrario. Esta proposición no necesita demostración, al ver que,

como la potencia mx es mayor que cualquiera de las otras potencias de x que entran en

la ecuación, se sigue que - a medida que x incrementa - incrementará mucho más rápido

que estas otras potencias; sin embargo, para no dejar dudas en la mente, debemos

ofrecer una demostración muy simple de esto. Esta demostración tendrá, además, la

ventaja de proporcionar un límite más allá del cual no podremos encontrar raíz alguna

para la ecuación.

Para este fin, supongamos primero que x es positiva, y que k es el mayor de los

coeficientes de los términos negativos. Si hacemos que 1+= kx , tendremos que

( ) ( ) ( ) .111 11 −− +++=+= mmmm kkkkx

De manera similar,

( ) ( ) ( )( ) ( ) ( ) ,111

,111332

221

−−−

−−−

+++=+

+++=+mmm

mmm

kkkk

kkkk

y así sucesivamente; de modo que, finalmente, tendremos

( ) ( ) ( ) ( ) .1...1111 321 ++++++++=+ −−− kkkkkkkk mmmm

Ahora, esta cantidad es evidentemente mayor que la suma de todos los términos

negativos de la ecuación tomados positivamente, en la suposición de que .1+= kx Por

lo tanto, la suposición 1+= kx hace necesariamente al primer término mx mayor que la

70

suma de todos los términos negativos. Consecuentemente, el valor de y tendrá el mismo

signo que x.

El mismo razonamiento y el mismo resultado valen cuando x es negativa. Si este

es el caso, simplemente tenemos que cambiar x en x− para la ecuación propuesta, para,

de esta forma, cambiar las raíces positivas en raíces negativas, y viceversa.

De la misma manera, se puede probar que si asignamos cualquier valor a x

mayor que ,1+k el valor de y tendrá todavía el mismo signo. De esto y de lo que se ha

dicho arriba, inmediatamente se sigue que la ecuación no puede tener una raíz igual o

mayor que .1+k

Por consiguiente, y de manera general, si k es el mayor de los coeficientes de los

términos negativos de una ecuación, y, si al cambiar la cantidad desconocida x en x− , h

es el mayor de los coeficientes de los términos negativos de la nueva ecuación -

suponiendo siempre que el primer término es positivo -, entonces todas las raíces reales

de la ecuación estarán necesariamente comprendidas entre los límites

1+k y .1−− h

Pero si en la ecuación hay varios términos positivos precediendo al primer

término negativo, podemos tomar para k una cantidad menor que el mayor coeficiente

negativo. En realidad, es fácil ver que la fórmula dada arriba puede ser puesta en la

forma

( ) ( )( ) ( )( ) ( )232 1...11111 ++++++++=+ −− kkkkkkkk mmm

y similarmente en lo siguiente

( ) ( ) ( ) ( ) ( ) ( )34232 1...11111 ++++++++=+ −− kkkkkkkk mmm

y así sucesivamente.

Por lo cual, es fácil inferir que si nm− es el exponente del primer término

negativo de la ecuación de m grado propuesta, y si l es el mayor coeficiente de los

términos negativos, será entonces suficiente que k sea determinada de manera que

( ) .1 1 lkk n =+ −

Y como podemos tomar para k cualquier valor mayor que queramos, será suficiente con

tomar

,lkn = ó .n lk =

Y lo mismo será válido para la cantidad h como el límite de las raíces negativas.

71

Si ahora cambiamos la cantidad desconocida x a ,1

z las raíces más grandes de la

ecuación en x serán convertidas en las más pequeñas en la nueva ecuación en z, y a la

inversa. Habiendo hecho esta transformación, y habiendo arreglado los términos de

acuerdo con las potencias de z, para que el primer término de la ecuación sea ,mz

podemos entonces buscar, de la misma manera, por los límites 1+K y 1−− H de las

raíces positivas y negativas de la ecuación en z.

Así, al ser 1+K mayor que el mayor valor de z o de ,1

x se sigue que, por la

naturaleza de las fracciones, 1

1

+K será menor que el menor valor de x; y, similarmente,

1

1

+H será menor que el menor valor negativo de x.

De donde se puede inferir que todas las raíces reales positivas estarán

comprendidas necesariamente entre los límites

1

1

+K y ,1+k

y que las raíces reales negativas estarán entre los límites

1

1

+−

H y .1−− h

Existen otros métodos encaminados a encontrar límites más cercanos, pero como

requieren de un trabajo considerable, el método precedente es, en la mayoría de los

casos, preferible, ya que es más simple y conveniente.

Por ejemplo, si en la ecuación propuesta zl + es sustituido por x, y si después de

haber arreglado los términos de acuerdo con las potencias de z, se le da a l un valor tal

que los coeficientes de todos los términos se vuelven positivos, es obvio que entonces

no habrá valor positivo de z que pueda satisfacer la ecuación. La ecuación tendrá

solamente raíces negativas, y, consecuentemente, l será una cantidad mayor que el

mayor de los valores de x. Ahora, es fácil ver que estos coeficientes serán expresados

como sigue:

,mlp +

( ) ( ),

2

11 2l

mmplmq

−+−+

( ) ( )( ) 2

2

212 pl

mmqlmr

−−+−+

72

( )( ),

3.2

21 3lmmm −−+

etc. En consecuencia, sólo es necesario buscar, por ensayo, el valor más pequeño de l

que los hará a todos positivos.

Pero en la mayoría de los casos no es suficiente con conocer los límites de las

raíces de una ecuación, sino lo importante es conocer los valores de estas raíces, por lo

menos de manera tan aproximada como las condiciones del problema lo requieran.

Porque cada problema conduce - en su último análisis - a una ecuación que contiene su

solución; y si no está en nuestras manos el resolver esta ecuación, todos los esfuerzos

puestos en su formulación son una pérdida total. Podemos considerar a este punto, por

lo tanto, como el más importante en todo el análisis, y es por esta razón por la que me

sentí obligado a hacerlo el tema principal de la presente lectura.

A partir de los principios establecidos arriba, referentes a la naturaleza de la

curva cuyas ordenadas y representan todos los valores que asume la parte izquierda de

una ecuación, se sigue que, si poseyéramos algunos medios para describir esta curva,

obtendríamos, de manera inmediata - debido a sus intersecciones con el eje - todas las

raíces de la ecuación propuesta. Pero para este propósito no es necesario considerar toda

la curva; es suficiente con conocer las partes que yacen - de manera inmediata - arriba y

debajo de cada punto de la intersección. Es posible encontrar tantos puntos de una curva

como queramos, y tan cerca unos de otros como queramos, al sustituir sucesivamente

por x números que tienen muy poca diferencia entre ellos, pero que, aún así, están lo

suficientemente cerca de nuestro propósito, y al tomar para y los resultados de estas

sustituciones en la parte izquierda de la ecuación. Si entre los resultados de estas

sustituciones se encuentran dos que tengan signos contrarios, podemos estar seguros,

debido a los principios establecidos arriba, de que entre estos dos valores de x habrá -

por lo menos - una raíz real. Y después podemos - a partir de nuevas sustituciones -

juntar estos dos límites todavía más y aproximarnos, tanto como queramos, a las raíces

buscadas.

Si llamamos al menor de los valores de x que han dado resultados con signos

contrarios A, y al mayor B, y suponiendo que queremos encontrar el valor de la raíz

dentro de un grado de exactitud denotado por n, donde n es una fracción de cualquier

grado de pequeñez que deseemos, procedemos a sustituir para x, de manera sucesiva, los

siguientes números en progresión aritmética:

,nA+ ,2nA+ ,...,3nA+

73

o

,nB − ,2nB − ,...,3nB −

hasta que se llegue a un resultado que tenga el signo contrario al obtenido por la

sustitución de A o de B. Entonces, uno de los dos valores sucesivos de x que han dado

resultados con signo contrario será necesariamente mayor que la raíz buscada, y el otro

menor; y como, por hipótesis, estos valores difieren uno del otro sólo por la cantidad n,

se sigue que cada uno de ellos se aproxima a la raíz buscada por menos de n, y que el

error es, por lo tanto, menor que n.

¿Pero cómo deben ser determinados los valores iniciales sustituidos por x, de tal

manera que, por una parte, podamos evitar tantos ensayos inútiles como sea posible, y,

por otra, estar seguros de que por este método hemos descubierto todas las raíces reales

de esta ecuación? Si examinamos la curva de la ecuación, se verá fácilmente que la

cuestión se resuelve por sí misma al seleccionar los valores de x de tal forma que por lo

menos uno de ellos esté entre dos intersecciones adyacentes. Y este será necesariamente

el caso si la diferencia entre dos valores consecutivos es menor que la menor distancia

entre dos intersecciones adyacentes.

Así, si suponemos que D es una cantidad menor que la menor distancia entre dos

intersecciones que se siguen inmediatamente una de la otra, podemos formar la

siguiente progresión aritmética

,0 ,D ,2D ,3D ,...,4D

y de esta progresión seleccionamos únicamente los términos que se encuentren entre los

límites

1

1

+K y ,1+k

como fueron determinados por el método ya expuesto. De esta manera, obtenemos

valores que, al ser sustituidos por x, finalmente nos darán todas las raíces positivas de la

ecuación, y, al mismo tiempo, nos darán los límites iniciales de cada raíz. De la misma

manera, formamos la siguiente progresión para obtener las raíces negativas

,0 ,D− ,2D− ,3D− ,...,4D−

de la cual también consideramos únicamente los términos comprendidos entre los

límites

1

1

+−

H y .1−− h

74

Así, se resuelve la dificultad. Pero todavía nos queda encontrar la cantidad D,

esto es, una cantidad menor que el menor intervalo entre cualesquiera dos intersecciones

adyacentes de la curva con el eje. Debido a que las abscisas que corresponden a las

intersecciones son las raíces de la ecuación propuesta, es claro que la cuestión se reduce

a encontrar una cantidad menor que la menor diferencia entre dos raíces, obviando (o no

considerando, pues) los signos. Por lo tanto, tenemos que buscar - a partir de los

métodos que fueron discutidos en las lecciones del curso principal - la ecuación cuyas

raíces sean las diferencias entre las raíces de la ecuación propuesta. Y después debemos

buscar - por los métodos expuestos arriba - una cantidad menor que la menor raíz de

esta última ecuación, y tomar esa cantidad como el valor de D.

Este método, como podemos ver, no deja nada que desear en lo que respecta a

proporcionar una solución rigurosa del problema, pero tiene la gran desventaja de

requerir, para este fin, cálculos extremadamente grandes, especialmente si la ecuación

propuesta es de una grado muy grande. Por ejemplo, si m es el grado de la ecuación

original, el de la ecuación de diferencias será ( ),1−mm porque cada raíz puede ser

sustraída de todas las raíces restantes, cuyo número es ,1−m lo que da ( )1−mm

diferencias. Pero como cada diferencia puede ser positiva o negativa, la ecuación de

diferencias debe tener las mismas raíces tanto en una forma positiva como en una

negativa; consecuentemente, la ecuación será defectuosa en todos los términos en los

que la cantidad desconocida sea elevada a una potencia impar; de manera que, al tomar

el cuadrado de las diferencias como la cantidad desconocida, ésta solamente puede

ocurrir en el grado ( )

.2

1−mm De acuerdo con esto, es necesaria para una ecuación de

grado m - al comienzo - una ecuación transformada de grado ( )

,2

1−mm que requiere

una enorme cantidad de trabajo tedioso si m es grande. Por ejemplo, para una ecuación

de grado 10, la ecuación transformada será de grado 45. Y como en la mayoría de los

casos esta desventaja hace que el método sea impracticable, resulta de gran importancia

encontrar los medios para remediar esto.

Para este fin, resumamos la ecuación propuesta de grado m,

,0...21 =++++ −− uqxpxx mmm

de la cual las raíces son a, b, c,…Tendremos, entonces que

0...21 =++++ −− uqapaa mmm

75

y también que

.0...21 =+++ −− uqbpbb mmm

Sea .iab =− Sustituimos este valor de b en la segunda ecuación, y, después de

desarrollar las diferentes potencias de ia + de acuerdo con el conocido teorema del

binomio, arreglamos la ecuación resultante de acuerdo con las potencias de i,

empezando con la más baja. Debemos tener la siguiente ecuación transformada

,0...2 =++++ miRiQiP

en donde los coeficientes P, Q, R,…tienen los siguientes valores

,...21 uqapaaP mmm ++++= −−

( ) ( ) ...21 321 +−+−+= −−− mmm qampammaQ

( ) ( )( ) ( )( )...

2

32

2

21

2

1 432 +−−+−−+−= −−− mmm qamm

pamm

amm

R

y así sucesivamente. La ley de transformación de estas expresiones es evidente.

Ahora bien, por la primera ecuación en a, tenemos .0=P Eliminando, por lo

tanto, al término P de la ecuación en i y dividiendo todos los términos restantes por i, la

ecuación en cuestión es reducida al grado ( )1−m , y tendrá la siguiente forma

.0... 12 =++++ −miSiRiQ

Esta ecuación tendrá para sus raíces las diferencias 1−m entre la raíz a y las

raíces restantes b, c,…De manera similar, si b es sustituido por a en las expresiones para

los coeficientes Q, R,…, obtendremos una ecuación cuyas raíces son la diferencia entre

la raíz b y las raíces restantes a, c,…, y así sucesivamente.

De acuerdo con esto, si podemos encontrar una cantidad menor que la raíz

menor de todas estas ecuaciones, poseerá la propiedad requerida y puede ser tomada

como la cantidad D, cuyo valor estamos buscando.

Si, por medio de la ecuación ,0=P a es eliminada de la ecuación en i, debemos

tener una nueva ecuación en i que contenga todas las otras ecuaciones de las que hemos

hablado, y en donde solamente será necesario buscar la raíz más pequeña. Pero esta

nueva ecuación en i no es nada más que la ecuación de diferencias de la que hemos

estado tratando de prescindir.

Pongamos la ecuación de arriba en i como .1

zi = Tendremos, entonces, la

siguiente ecuación transformada en z,

76

,01

...321 =++++ −−−

Qz

Q

Sz

Q

Rz mmm

y el mayor coeficiente negativo de esta ecuación dará, por lo que se ha demostrado

arriba, una valor mayor que su mayor raíz; de manera que, si llamamos L a este

coeficiente mayor, 1+L será una cantidad mayor que el mayor valor de z.

Consecuentemente, 1

1

+L será una cantidad menor que el menor valor positivo de i; y, a

partir de una manera parecida, encontraremos una cantidad menor que la menor

cantidad negativa de i. De acuerdo con esto, podemos tomar por D a la menor de estas

dos cantidades, o a alguna cantidad menor que cualquiera de ellas.

Para un resultado más simple, y que, además, es independiente de los signos,

podemos reducir la cuestión a encontrar una cantidad L que sea numéricamente mayor

que cualquiera de los coeficientes de la ecuación en z, y es evidente que si encontramos

una cantidad N numéricamente menor que el menor valor de Q, y una cantidad M

numéricamente mayor que el mayor valor de cualquiera de las cantidades R, S,…,

podemos decir que .N

ML =

Comencemos por encontrar los valores de M. No es difícil demostrar - por los

principios establecidos arriba -, que si 1+k es el límite de las raíces positivas y 1−− h

el límite de las raíces negativas de la ecuación propuesta, y 1+k y 1−− h son

sucesivamente sustituidos por a en las expresiones por R, S,…, - considerando

únicamente los términos que tienen el mismo signo como el primero - obtendremos

cantidades que son mayores que los mayores valores positivos y negativos de R,

S,…,correspondientes a las raíces a, b, c,…, de la ecuación propuesta; de manera que

podemos tomar para M la cantidad que numéricamente es la mayor de estas.

Sólo nos queda encontrar un valor menor que el menor valor de Q. Parece ser

que únicamente podemos conseguir esto si empleamos la ecuación cuyos diferentes

valores de Q son las raíces; una ecuación que sólo podemos conseguir si eliminamos a

de las siguientes ecuaciones:

,0...21 =++++ −− uqapaa mmm

( ) ( ) ....21 321 Qqampamma mmm =+−+−+ −−−

Puede ser fácilmente demostrado - a partir de la teoría de la eliminación - que la

ecuación resultante en Q será de grado m, esto es, del mismo grado que la ecuación

propuesta; y también puede ser demostrado - a partir de la forma de las raíces de esta

77

ecuación - que no habrá un siguiente al último término. Si, de acuerdo con esto,

buscamos - a partir del método expuesto arriba - una cantidad numéricamente menor

que la menor raíz de esta ecuación, esta cantidad encontrada puede ser considerada

como N. Por lo tanto, el problema es resuelto por medio de una ecuación del mismo

grado que la ecuación propuesta.

El resultado de todo esto es como sigue (por razones de simplicidad conservo la

letra x en lugar de la letra a).

Sea lo siguiente la ecuación de grado m propuesta:

;0...321 =++++ −−− mmmm rxqxpxx

sea k el mayor coeficiente de los términos negativos, y nm− el exponente de x en el

primer término negativo. Similarmente, sea h el mayor coeficiente de los términos que

tienen un signo contrario al primer término después de que x haya sido cambiada a ;x−

y sea 'nm− el exponente de x en el primer término que tenga un signo contrario al

primer término de la ecuación así alterada. Poniendo, entonces

n kf 1+= y ,1'n hg +=

tendremos a f y a g− como los límites de las raíces positivas y negativas. Estos

límites son después sustituidos sucesivamente por x en las siguientes fórmulas,

omitiendo los términos que tienen el mismo signo como el primer término:

( ) ( )( )

( )( )...,

2

322

21

2

1

4

32

+−−+

−−+−

−

−−

m

mm

qxmm

pxmm

xmm

( )( )

( )( )( )...,

3.2

3213.2

21

4

3

+−−−+

−−

−

−

m

m

pxmmm

xmmm

y así sucesivamente. De estas fórmulas habrá .2−m Sea M la mayor de las cantidades

numéricas obtenidas de esta forma. Después tomamos la ecuación

( ) ( ) ( ) yrxmqxmpxmmx mmmm =+−+−+−+ −−−− ...321 4321

y eliminamos x de ella por medio de la ecuación propuesta, lo que nos da una ecuación

en y de grado m en donde falta lo siguiente al último término. Sea V el último término

de esta ecuación en y, y T el mayor coeficiente de los términos que tienen signo

contrario a V, suponiendo a y tanto positiva como negativa. Después, tomando a estas

dos cantidades T y V como positivas, N será determinada por la ecuación

78

n

T

V

N

N =−1

,

donde n es igual al exponente del último término con signo contario a V. Después

tomamos a D como igual o menor que la cantidad ,NM

N

+ e interpolamos la progresión

aritmética:

,0 ,D ,2D ,...,3D ,D− ,2D− ,...3D−

entre los límites f y .g− Los términos de estas progresiones - al ser sucesivamente

sustituidos por x en la ecuación propuesta - revelarán todas las raíces reales, tanto

positivas como negativas, por los cambios de signo en la serie de resultados producidos

por estas sustituciones, y darán, al mismo tiempo, los primeros límites de estas raíces -

límites que, como ya sabemos, pueden ser tan reducidos como queramos -.

Si el último término V de la ecuación en y resultante de la eliminación de x es

cero, entonces N será cero, y, consecuentemente, D será igual a cero. Pero en este caso

es claro que la ecuación en y tendrá una raíz igual a cero e incluso dos, porque falta lo

siguiente al último término. Por consiguiente, la ecuación

( ) ( ) 0...21 321 =+−+−+ −−− mmm qxmpxmmx

será válida al mismo tiempo con la ecuación propuesta. Debido a esto, estas dos

ecuaciones tendrán un común divisor, que puede ser encontrado por el método

ordinario, y que, puesto igual a cero, dará una o varias raíces de la ecuación propuesta, y

que serán dobles o múltiples, como es evidente debido a la teoría precedente; si el

último término Q de la ecuación en i es cero, se sigue que

0=i y .ba =

La ecuación en y es reducida, debido a la desaparición de su último término, al grado

2−m , siendo, pues, divisible por .2y Si después de esta división su último término

sigue siendo cero, será una indicación de que tiene más de dos raíces iguales a cero, y

así sucesivamente. En tal caso, debemos dividirla entre y tantas veces como sea

posible, y después tomar su último término como V, y el mayor coeficiente de los

términos de signo contrario a V como T, con el fin de obtener el valor de D, que nos

permitirá encontrar todas las raíces restantes de la ecuación propuesta. Si la ecuación

propuesta es de tercer grado, como

,03 =++ rqxx

debemos tener, para la ecuación en y,

79

.02743 2323 =−−+ rqqyy

Si la ecuación propuesta es

024 =+++ srxqxx

debemos tener, para la ecuación en y, lo siguiente:

( )027414416

12825618164843224

22322334

=−−++−++−++

rqrsqrsq

qssyrqsqryy


Ya que, sin embargo, el encontrar la ecuación en y por los métodos ordinarios de

eliminación puede resultar en extremo difícil, proporciono aquí las fórmulas generales

para tal propósito, derivadas de las propiedades conocidas de las ecuaciones. Primero,

formamos, a partir de los coeficientes p, q, r de la ecuación propuesta, las cantidades x1,

x2, x3,…, de la siguiente manera:

x1 = ,p−

x2 = p− x1 ,2q−

x3 = p− x2 q− x1 r3− ,

……………………………

Después sustituimos en las expresiones por y, ,2y 3y ,… hasta my - después de que los

términos en x han sido desarrollados - las cantidades x1 por x, x2 por ,2x x3 por 3x , etc.,

y designamos por y1, y2, y3…los valores de y, ,2y 3y ,…resultantes de estas

sustituciones. Después, simplemente tenemos que formar las cantidades A, B, C a partir

de las fórmulas

,1yA =

,2

21 yAyB

−=

,3

321 yAyByC

+−=

………………………………,

y tendremos la siguiente ecuación en y:

.0...321 =+−+− −−− mmmm CyByAyy

El valor, o más bien el límite de D, que encontramos por el método expuesto, a

menudo puede ser mucho más pequeño de lo que es necesario para encontrar todas las

raíces, pero no habrá más inconvenientes en esto que el tener que incrementar el número

80

de sustituciones sucesivas por x en la ecuación propuesta. Además, cuando hay tantos

resultados encontrados como unidades en el exponente más grande de la ecuación,

podemos continuar estos resultados tanto como queramos por la simple adición de la

primera, segunda, tercera diferencias, etc., porque las diferencias del orden

correspondiente al grado de la ecuación son siempre constantes.

Hemos visto antes cómo la curva de la ecuación propuesta puede ser construida

al dar sucesivamente diferentes valores a las abscisas x y tomar por las ordenadas y los

valores resultantes de estas sustituciones en la parte izquierda de la ecuación. Pero estos

valores para y también pueden ser encontrados a partir de otra construcción sumamente

simple, y que requiere ahora nuestra atención. Representemos la ecuación propuesta por

0...32 =++++ dxcxbxa

donde los términos están tomados en el orden inverso. La ecuación de la curva será,

entonces

....32 ++++= dxcxbxay

Fig. 2

Trazando (Fig. 2) la línea recta 0X, que tomamos como el eje de las abscisas con 0

como origen, desplegamos en esta línea el segmento 0I, igual a la unidad en términos

por la cual suponemos deben ser expresados las cantidades a, b, c,…; y erigimos en los

puntos 0I las perpendiculares 0D, IM. Después, desplegamos en la línea 0D los

segmentos

81

0A = a, AB = b, BC = c, CD = d,...,

etc. Sea 0P = x, y en el punto P erijamos la perpendicular PT. Supongamos, por

ejemplo, que d es el último de los coeficientes a, b, c,…, de manera que la ecuación

propuesta es solamente de tercer grado, y que el problema es encontrar el valor de

.32 dxcxbxay +++=

Siendo el punto D el último de los puntos determinados sobre la perpendicular 0D, y el

punto C el penúltimo, trazamos a lo largo de D la línea DM paralela al eje 0I, y a lo

largo del punto M, donde esta línea corta la perpendicular IM, trazamos la línea recta

CM conectando M con C. Después, a lo largo del punto S, donde esta última línea recta

corta la perpendicular PT, trazamos HSL paralela a 0I, y a lo largo del punto L, donde

esta paralela corta la perpendicular IM, trazamos, hasta el punto B, la línea recta BL. De

manera similar, a lo largo del punto R, donde esta última línea corta la perpendicular

PT, trazamos GRK paralela a 0I, y a lo largo del punto K, donde esta paralela corta la

perpendicular IM, trazamos, al primer punto de división A de la perpendicular D0, la

línea recta AK. El punto Q, donde esta línea recta corta la perpendicular PT, dará el

segmento PQ = y.

A lo largo de Q, trazamos la línea FQ, paralela al eje 0P. Los dos triángulos

similares CDM y CHS dan

DM(1): DC(d) = HS(x): CH(= dx).

Añadiendo CB © tenemos

BH = c + dx.

También los dos triángulos similares BHL y BGR dan

HL(1): HB(c + dx) = GR(x): BG(= cx + dx2).

Añadiendo AB (b), tenemos que

AG = b + cx + dx2.

Finalmente, los triángulos similares AGK y AFQ dan

GK(1): GA(b + cx + dx2) = FQ (x): FA(=bx + cx2 +dx3),

y obtenemos, al añadir 0A (a)

0F = PQ = a + bx + cx2 + dx3 = y.

La misma construcción y la misma demostración son válidas, sin importar cuál

sea el número de términos en la ecuación propuesta. Cuando hay coeficientes negativos

entre a, b, c,…, simplemente es necesario tomarlos en la dirección opuesta a la de los

coeficientes positivos. Por ejemplo, si a fuese negativa, tendríamos que poner el

82

segmento 0A por debajo del eje 0I. Después empezaríamos desde el punto A y le

añadiríamos el segmento AB = b. Si b fuese positiva, AB tendría que ser tomado en la

dirección 0D; pero si b fuese negativa, AB tendría que ser tomada en la dirección

opuesta, y así con el resto.

Con lo que respecta a x, 0P es tomada en la dirección de 0I, que se supone igual

a la unidad positiva, cuando x es positiva; pero en la dirección opuesta cuando x es

negativa.

No sería difícil construir, en el modelo precedente, un instrumento que fuera

aplicable a todos los valores de los coeficientes a, b, c,…, y que, por medio de un

número de reglas móviles y propiamente conjuntadas, diera, para cada punto P de la

línea recta 0P, el correspondiente punto Q, y que incluso pudiese ser esto hecho por un

movimiento continuo para describir la curva. Tal instrumento podría ser usado para

resolver ecuaciones de cualquier grado; por lo menos podría ser usado para encontrar

los primeros valores aproximados de las raíces, y a partir de lo cual, después, poder

encontrar valores más exactos.

83

LECCIÓN V

SOBRE EL EMPLEO DE CURVAS EN LA SOLUCIÓN

DE PROBLEMAS

Todo el tiempo que el álgebra y la geometría recorrieron caminos distintos, su

avance fue lento y sus aplicaciones limitadas. Pero cuando estas dos ciencias se unieron,

cada una extrajo de la otra una nueva y fresca vitalidad, y, a partir de entonces, se

acercaron a la perfección. Es a DESCARTES a quien debemos la aplicación del álgebra

en la geometría, - una aplicación que ha hecho posible llevar a cabo los mayores

descubrimientos en todas las ramas de las matemáticas -. El método que recién expuse

para encontrar y demostrar diversas propiedades generales de las ecuaciones al

considerar las curvas que las representan, es, propiamente hablando, una especie de

aplicación de la geometría al álgebra, y como este método ha extendido sus

aplicaciones, y es capaz de resolver fácilmente problemas cuya solución directa sería en

extremo difícil o incluso imposible, considero que es adecuado atraer su atención en

esta lección con una indagación más profunda sobre este tema, y más considerando que

no se encuentra comúnmente en los trabajos elementales de álgebra.

Ustedes han visto cómo una ecuación de cualquier grado puede ser resuelta por

medio de una curva, de la cual las abscisas representan la cantidad desconocida de la

ecuación, y las ordenadas los valores que la parte izquierda asume para cada valor de la

cantidad desconocida. Es evidente que este método puede ser aplicado - de manera

general - a todas las ecuaciones, sea cual sea su forma, y solamente se requiere que éstas

sean desarrolladas y acomodadas de acuerdo con las diferentes potencias de la cantidad

desconocida. Simplemente es necesario llevar todos los términos de la ecuación a un

lado, de tal forma que el otro lado sea igual a cero. Después, tomar la cantidad

desconocida por la abscisa x, y la función de la cantidad desconocida, o la cantidad

compuesta de esa cantidad y las cantidades conocidas - que forma una parte de la

ecuación - por la ordenada y; la curva descrita por estas coordenadas x e y dará, por las

intersecciones con el eje, aquellos valores de x que son las raíces requeridas de la

ecuación. Y como frecuentemente no es necesario conocer todos los posibles valores de

la cantidad desconocida sino sólo aquellos que resuelven el problema con el que se está

84

tratando, será suficiente con describir aquella porción de la curva que corresponde a

estas raíces, evitando así muchos cálculos innecesarios. De esta manera, incluso

podemos determinar, a partir de la forma de la curva, si el problema tiene soluciones

posibles que satisfagan las condiciones propuestas.

Supongamos, por ejemplo, que queremos encontrar, en la línea que une dos

puntos luminosos de una intensidad dada, el punto que recibe una cantidad dada de luz,

siendo esta ley física la que establece que la intensidad de luz decrece con el cuadrado

de la distancia.

Sea a la distancia entre las dos luces y x la distancia entre el punto buscado y una

de las luces, cuya intensidad en unidad de distancia es M, y la intensidad de la otra en

esa distancia es N. Las expresiones 2x

M y ( ) ,

2xa

N

−en consecuencia, darán la intensidad

de las dos luces en el punto en cuestión, de manera que, al designar el efecto total dado

por A, tenemos la ecuación

( ) Axa

N

x

M =−

+22

o

( ) .022

=−−

+ Axa

N

x

M

Consideraremos ahora a la curva teniendo la ecuación

( ) yAxa

N

x

M =−−

+22

en donde inmediatamente se verá que, al dar a x un valor muy pequeño, positivo o

negativo, el término 2x

M, mientras continúa siendo positivo, crecerá mucho, porque una

fracción incrementa en proporción a medida que su denominador decrece, y será infinita

cuando .0=x Además, si x incrementa, la expresión 2x

M disminuirá de manera

constante; pero la otra expresión ( )2xa

N

−, que era

2a

N cuando ,0=x se incrementará

de manera constante hasta que se vuelva muy grande o infinita cuando x tenga un valor

muy cercano o igual a a.

De acuerdo con esto, si, al dar a x valores desde cero a a, se puede hacer que la

suma de estas expresiones sea menor que la cantidad dada A, entonces el valor de y, que

85

al principio era muy grande y positivo, será negativo, y, más tarde, de nuevo será muy

grande y positivo. Consecuentemente, la curva cortará dos veces al eje entre las dos

luces, y el problema tendrá dos soluciones. Éstas son reducibles a una simple ecuación

si el menor valor de

( )22 xa

N

x

M

−+

es exactamente igual a A, y serán imaginarias si ese valor es mayor que A, porque

entonces el valor de y será siempre positivo desde 0=x a .ax = De esto resulta

evidente que si una de las condiciones del problema es que el punto requerido se

encuentre entre las dos luces, es posible que el problema no tenga solución. Pero si se

permite al punto estar en la prolongación de la línea que une a las dos luces, veremos

que el problema es siempre resoluble de dos maneras. De hecho, suponiendo que x sea

negativa, es obvio que el término 2x

M permanecerá siempre positivo, y, de ser muy

grande cuando x es cercana a cero, comenzará a decrecer y continuará haciéndolo a

medida que x se incrementa, hasta que se vuelva muy pequeño o incluso cero cuando x

sea muy grande o infinita.

El otro término ( ) ,2xa

N

−que al principio era igual a

2a

N, también disminuye hasta que

se vuelve cero cuando x es infinitamente negativa. Será lo mismo si x es positiva y

mayor que a; porque cuando ax = , la expresión ( )2xa

N

− será infinitamente grande;

después, continuará decreciendo hasta que se vuelva cero cuando x sea infinita, mientras

que la otra expresión 2x

M será primero igual a

2a

M, y también continuará disminuyendo

hacia cero a medida que x incrementa.

Por lo tanto, cualquiera sea el valor de la cantidad de A, es obvio que los valores

de y necesariamente pasarán de positivo a negativo, tanto cuando x sea negativa como

cuando sea positiva y mayor que a. De acuerdo con esto, habrá un valor negativo de x y

un valor positivo de x mayor que a que resolverá el problema para todos los casos. Estos

valores pueden ser encontrados por el método general al sucesivamente causar que los

valores de x - que dan valores de y con signos contrarios - se aproximen cada vez más

entre ellos.

86

Con respecto a los valores de x que son menores que a, hemos visto que la

realidad de estos valores depende del menor valor de la cantidad

( ) .22 xa

N

x

M

−+

Las direcciones para encontrar a los menores y mayores valores de cantidades variables

están dadas en el cálculo diferencial. Aquí nos contentaremos con remarcar que la

cantidad en cuestión será un mínimo cuando

;3

N

M

xa

x =−

de tal manera que tendremos

,3 3

3

NM

Max

+=

de donde obtendremos, como el menor valor de la expresión

( ) ,22 xa

N

x

M

−+

la cantidad

( ).

2

333

a

NM +

Por lo tanto, habrá dos valores reales para x si esta cantidad es menor que A; pero estos

valores serán imaginarios si es mayor. El caso de igualdad dará dos valores iguales para

x.

He ocupado un tiempo considerable en el análisis de este problema (aunque por

sí mismo sea de gran importancia), porque puede servir para la resolución de casos

análogos.

La ecuación del problema precedente, habiendo sido liberada de fracciones,

asume la siguiente forma:

( ) ( ) .02222 =−−−− NxxaMxaAx

Con sus términos desarrollados y propiamente arreglados, se verá que es una ecuación

de cuarto grado y que, consecuentemente, tiene cuatro raíces. Ahora bien, por el análisis

que acabamos de hacer, podemos reconocer, de manera inmediata, el carácter de estas

raíces. Y como de esta consideración puede surgir un método aplicable a todas las

ecuaciones de cuarto grado, haremos, de paso, unas pocas y pequeñas consideraciones

sobre ella.

87

Sea la ecuación general

.024 =+++ rqxpxx

Ya hemos visto que si el último término de esta ecuación es negativo, necesariamente

tendrá dos raíces reales, una positiva y una negativa; pero si el último término es

positivo, no podemos inferir nada acerca del carácter de sus raíces. Si damos a esta

ecuación la siguiente forma

( ) ( ) ( ) ,022222 =−+++− axcaxbax

una forma que, desarrollada, se convierte en

( ) ( ) ( ) ,022 24224 =+++−+−++ cbaaxcbaxacbx

y si de esto, por comparación, surgen las siguientes ecuaciones de condición

,2 2 pacb =−+ ( ) ,2 qcba =− ( ) ,24 rcbaa =++

y de éstas, de nuevo, lo siguiente,

,2 2apcb +=+ ,2a

qcb =− ,3 24 rpaa =+

obtendremos, al resolver la última ecuación, que

.3636

22 prp

a ++−=

Si r se supone positiva, 2a será positiva y real, y, por lo tanto, a será real;

consecuentemente, también b y c serán reales.

Habiendo determinado de esta forma las cantidades a, b, y c, obtenemos la

ecuación transformada

( ) ( ) ( ) .02222 =−+++− axcaxbax

Poniendo la parte derecha de esta ecuación igual a y, y considerando a la curva

teniendo como abscisas a los diferentes valores de y, es obvio que, cuando b y c son

cantidades positivas, la curva yacerá - en su totalidad - arriba del eje, y, por lo tanto, la

ecuación no tendrá raíz real. En segundo lugar, si suponemos que b es una cantidad

negativa y c una positiva, entonces ax = dará ,4 2bay = una cantidad negativa. Una x

muy grande - positiva o negativa - dará entonces una y muy grande y positiva; y de esto

es fácil concluir que la ecuación tendrá dos raíces reales, una mayor que a y una menor

que a. De igual forma, encontraremos que si b es positiva y c negativa, la ecuación

tendrá dos raíces reales, una mayor y una menor que .a− Finalmente, si b y c son

ambas negativas, entonces y será negativa al hacer que

88

ax = y ax −= ,

y será positiva y muy grande para un valor de x muy grande (positivo o negativo); de

donde se sigue que la ecuación tendrá dos raíces reales, una mayor que a y una menor

que .a− Las consideraciones precedentes pueden ser extendidas, pero por ahora

debemos renunciar a su búsqueda.

Se verá del ejemplo precedente que la consideración de la curva no requiere que

la ecuación esté libre de expresiones fraccionarias. Lo mismo puede decirse de las

expresiones radicales. Incluso existe una ventaja en retener estas expresiones en la

forma dada por el análisis del problema; y es que podemos, de esta manera, limitar

nuestra atención a aquellos signos de los radicales que respondan a las exigencias

especiales de cada problema, en lugar de hacer que las fracciones y los radicales

desaparezcan, y así obtener una ecuación acomodada de acuerdo a las distintas

potencias enteras de la cantidad desconocida, y en donde frecuentemente son

introducidas raíces que son completamente ajenas a la cuestión propuesta. Es verdad

que estas raíces son siempre parte de la cuestión si ésta es vista en toda su extensión;

pero esta riqueza del análisis algebraico, aunque por sí misma y desde un punto de vista

general es extremadamente valiosa, puede resultar inconveniente y gravosa en casos

particulares en donde la solución que necesitamos no puede ser encontrada por métodos

directos, esto es, de manera independiente de cualesquiera otras soluciones posibles.

Cuando la ecuación que inmediatamente fluye de las consideraciones del problema

contiene radicales esencialmente ambiguos en cuanto a signo se refiere, la curva de esa

ecuación (construida al hacer que el lado igual a cero sea igual a la ordenada y)

necesariamente tendrá tantas ramas como haya posibles combinaciones diferentes de

estos signos; y para su solución completa, será necesario considerar cada una de estas

ramas. Pero esta generalidad puede ser restringida por las condiciones particulares del

problema que determinan la rama en la cual se busca la solución; el resultado de esto es

que nos evitamos muchos cálculos innecesarios - una ventaja que, por cierto, no es la

menos importante de las que nos ofrece el método de resolver ecuaciones a partir de la

consideración de curvas -.

Pero este método puede ser todavía más generalizado, e incluso hacerse

independiente de la ecuación del problema. Es suficiente con considerar - al aplicarlo -

las condiciones del problema por sí mismas, con dar a la cantidad desconocida valores

arbitrarios distintos, y con determinar - a partir de cálculos o construcciones - los errores

que resultan de tales suposiciones de acuerdo con las condiciones originales. Tomando

89

estos errores como las ordenadas y de una curva que tiene por abscisas los valores

correspondientes de la cantidad desconocida, obtenemos una curva continua llamada

curva de errores, que, debido a sus intersecciones con el eje, también proporciona todas

las soluciones del problema. Así, si se encuentran dos errores sucesivos, uno de los

cuales es un exceso, y el otro un defecto, esto es, uno positivo y otro negativo, podemos

concluir, enseguida, que entre estos dos valores correspondientes de la cantidad

desconocida habrá uno cuyo error será cero, y al cual nos podemos acercar tanto como

queramos por sustituciones sucesivas, o por la descripción mecánica de la curva.

Este modo de resolver cuestiones a partir de curvas de errores es uno de los más

útiles que se han creado. Se emplea constantemente en la astronomía cuando las

soluciones directas son difíciles o imposibles. También puede ser empleado para

resolver problemas importantes de la geometría y la mecánica, e incluso de la física. Es,

propiamente hablando, la regula falsi, tomada en su sentido más general, y hecha

aplicable a todas las cuestiones donde existe una cantidad desconocida a ser

determinada. También puede ser aplicado a problemas que dependan de dos o más

cantidades desconocidas, a partir de dar sucesivamente a estas cantidades desconocidas

distintos valores arbitrarios y calcular los errores que resultan de los mismos, y,

después, enlazarlos unos con otros por curvas diferentes, o reducirlos a tablas; siendo el

resultado de todo esto que podamos obtener directamente la solución buscada sin tener

que eliminar previamente las cantidades desconocidas. Ilustraremos esto a partir de unos

ejemplos.

Fig. 3

90

Se requiere un círculo en donde pueda ser inscrito un polígono de lados dados.

Este problema produce una ecuación que es proporcional en grado al número de

lados del polígono. Para resolverlo por el método recién expuesto, describimos

cualquier círculo ABCD (Fig. 3) y trazamos en este círculo los lados dados AB, BC,

CD, DE, EF del polígono que, por razones de simplicidad, supongo que es pentagonal.

Si el extremo del último lado cae sobre A, el problema está resuelto. Pero como es muy

improbable que esto suceda en un primer intento, trazamos, sobre la línea recta PR (Fig.

4), el radio PA del círculo, y erigimos sobre él - en el punto A - la perpendicular AF

igual a la cuerda AF del arco AF que representa el error en la suposición hecha con

respecto a la longitud del radio PA.

Fig. 4

Como este error es un exceso, será necesario describir un círculo que tenga un radio

mayor y hacer la misma operación que hicimos antes, y así varias veces, con círculos de

varios tamaños. Así, el círculo con el radio PA produce el error F’A’ que, como cae en

el lado más cercano del punto A’, debe ser considerado como negativo.

Consecuentemente, será necesario (Fig. 4) - al aplicar la ordenada A’F’ a la abscisa PA’

- trazar esa ordenada por debajo del eje. De esta manera, obtendremos distintos puntos

F, F’,…, que yacen en una curva cuya intersección R con el eje PA dará el verdadero

radio PR del círculo que satisface el problema, y encontraremos esta intersección al

91

causar sucesivamente que los puntos de la curva que están a ambos lados del eje (F,

F’…) se acerquen cada vez más unos con otros.

Desde un punto, cuya posición es desconocida, se observan tres objetos, cuyas

distancias unos de otros son conocidas. Los tres ángulos formados por los rayos de luz

desde estos tres objetos al ojo del observador son también conocidos. Se requiere la

posición del observador con respecto a los tres objetos.

Si los tres objetos son unidos por tres líneas rectas, es obvio que estas tres líneas

formarán - con los rayos visuales desde el ojo del observador - una pirámide triangular

cuya base y tres ángulos de la cara que forman el ángulo sólido en el vértice son dados.

Y como se supone que el observador está situado en el vértice, la cuestión se reduce a

determinar las dimensiones de esta pirámide.

Como la posición de un punto en el espacio está completamente determinada por

sus tres distancias desde tres puntos dados, es evidente que el problema se resolverá si

las distancias del punto en donde el observador está situado a cada uno de los tres

objetos pueden ser determinadas. Tomando estas tres distancias como las cantidades

desconocidas, tendremos tres ecuaciones de segundo grado que, después de la

eliminación correspondiente, producirán una ecuación resultante de octavo grado; pero

considerando sólo una de estas distancias y las relaciones de las otras dos con ella como

las cantidades desconocidas, la ecuación final será solamente de cuarto grado. De

acuerdo con esto, podemos, de manera rigurosa, resolver este problema a partir de los

métodos conocidos; pero la solución directa, que es complicada e inconveniente en la

práctica, puede ser reemplazada por la siguiente, que se alcanza por la curva de errores.

Fig. 5

92

Constrúyanse los tres ángulos sucesivos APB, BPC, CPD (Fig. 5), teniendo al

vértice P y respectivamente igual a los ángulos observados entre el primer objeto y el

segundo, el segundo y el tercero, el tercero y el primero; y tómese la línea PA al azar

para representar la distancia del observador al primer objeto. Como se supone que la

distancia de ese objeto al segundo es conocida, denótese por AB, y trácese la línea AB.

De esta manera, debemos obtener la distancia BP del segundo objeto al observador. De

igual forma, sea trazada en BC - la distancia del segundo objeto al tercero - la línea BC,

y tendremos la distancia PC de ese objeto con el observador. Si, ahora, la distancia del

tercer objeto con el primero se traza en la línea CD, tendremos a PD como la distancia

del primer objeto con el observador. Consecuentemente, si la distancia que primero

asumimos es exacta, las dos líneas PA y PD necesariamente tendrán que coincidir. Por

lo tanto, trazando en la línea PA, prolongada si es necesario, el segmento PE = PD, si el

punto E no cae sobre el punto A, la diferencia será el error de la primera suposición PA.

Habiendo trazado la línea recta PR (Fig. 6), suspendemos sobre ella, desde el punto fijo

P, la abscisa PA, y aplicamos a ella, en ángulos rectos, la ordenada EA; tendremos al

punto E de la curva de errores ERS.

Fig. 6

Tomando otras distancias por PA, y haciendo la misma construcción, obtendremos otros

errores que similarmente pueden ser aplicados a la línea PR, y que nos darán otros

puntos en la misma curva.

De esta forma podemos trazar esta curva a lo largo de distintos puntos, y el

punto R, donde corta al eje PR, nos dará la distancia PR, cuyo error es cero, y que

93

consecuentemente representará la distancia exacta del observador con respecto al primer

objeto. Siendo conocida esta distancia, las demás pueden ser obtenidas a partir de la

misma construcción.

Debe remarcarse que la construcción que hemos estado considerando da para

cada punto A de la línea PA, dos puntos B y B’ de la línea PB; y esto es porque, como

la distancia AB está dada, para encontrar el punto B sólo es necesario describir - del

punto A como centro y con radio AB - un arco de un círculo que corte la línea recta PB

en los dos puntos B y B’, y ambos puntos satisfacen las condiciones del problema. De la

misma manera, cada uno de estos últimos puntos mencionados dará dos más en la línea

recta PC, y cada uno de los últimos dará dos más en la línea recta PD. De esto se sigue

que cada punto A tomado sobre la línea recta PA dará, en general, ocho puntos sobre la

línea recta PD, todos de los cuales deben estar separados y considerados sucesivamente

para obtener todas las soluciones posibles. He dicho en general, porque es posible

(1) que los dos puntos B y B’ coincidan en un único punto, lo que sucederá cuando el

círculo descrito con el centro A y el radio AB toque la línea recta PB; y (2) que el

círculo no corte la línea recta PB en absoluto, en cuyo caso el resto de la construcción es

imposible, y lo mismo debe decirse respecto a los puntos C, D. De acuerdo con esto, es

necesario trazar la línea GF paralela a BP y a una distancia a ella igual a la línea dada

AB; el punto F - en el que esta línea corta la línea PE, prolongada si es necesario - será

el límite más allá del cual no deben considerarse los puntos A si queremos obtener

soluciones posibles. También existen límites para los puntos B y C, y pueden ser

empleados para restringir las primeras suposiciones hechas con respecto a la distancia

PA.

Los ocho puntos D, que dependen, en general, de cada punto A, responden a las

ocho soluciones de las cuales el problema es susceptible, y cuando uno no tiene datos

especiales por medio de los cuales pueda determinar cuál de estas soluciones responde

mejor al caso propuesto, es indispensable comprobar todas ellas empleando, para cada

una de las ocho combinaciones, una curva especial de errores. Pero si se sabe, por

ejemplo, que la distancia del observador al segundo objeto es mayor o menor que su

distancia al primero, será necesario tomar, en la línea PB, únicamente el punto B en el

primer caso y el punto B’ en el segundo. Este camino reducirá las ocho combinaciones a

la mitad. Si tenemos los mismos datos respecto al tercero objeto en relación con el

segundo, y con respecto al primer objeto relacionado con el tercero, entonces los puntos

C y D podrán ser determinados, y tendremos una única solución.

94

Estos dos ejemplos pueden ser suficientes para ilustrar los usos que este método

de curvas tiene para solucionar problemas. Pero este método, que hemos presentado, por

decirlo de alguna manera, de una manera mecánica, también puede ser presentado en

forma de análisis.

En realidad, toda la cuestión es reducible a la descripción de una curva que debe

pasar a través de un determinado número de puntos, ya sea que estos puntos estén dados

por cálculos o por construcción, o por observación o por simples experiencias

completamente independientes unas de las otras. El problema es, en verdad,

indeterminado, porque, estrictamente hablando, puede construirse un número infinito de

distintas curvas que pasen a través de un número dado de puntos, ya sean aquellas

regulares o irregulares, esto es, sujetas a ecuaciones o trazadas arbitrariamente con la

mano. Pero la cuestión no es encontrar cualesquiera soluciones, sino las más simples en

la práctica.

Así, si hay solamente dos puntos dados, la solución más simple es trazar una

línea recta entre los dos puntos. Si hay tres puntos dados, se debe trazar el arco de un

círculo a través de estos puntos, porque el arco de un círculo, después de la línea recta,

es la línea más simple que puede ser descrita.

Pero si el círculo es la curva más simple con respecto a la descripción, no lo es

con respecto a la ecuación entre sus abscisas y las ordenadas rectangulares. Bajo este

último punto de vista, aquellas curvas pueden ser consideradas como las más simples, y

sus ordenadas son expresadas por una función integral racional de las abscisas, como en

la siguiente ecuación

...,32 ++++= dxcxbxay

donde y es la ordenada y x la abscisa. Las curvas de esta clase son llamadas, en general,

parabólicas, porque pueden ser consideradas como una generalización de la parábola

(una curva representada por la ecuación precedente cuando ésta tiene sólo los primeros

tres términos). Ya hemos ilustrado su empleo al resolver ecuaciones, y su consideración

es siempre útil en la descripción aproximativa de las curvas, por la razón de que una

curva de este tipo siempre puede ser construida para pasar a través de tantos puntos de

una curva dada como queramos, siendo necesario únicamente tomar o considerar tantos

coeficientes indeterminados a, b, c,… como haya puntos dados, y determinar estos

coeficientes para obtener las abscisas y ordenadas para estos puntos. Ahora bien, es

evidente que cualquiera sea la curva propuesta, la curva parabólica así descrita siempre

95

diferirá de aquella cada vez menos si el número de los diferentes puntos es cada vez

mayor, y si la distancia de una a otra es cada vez menor.

NEWTON fue el primero en proponer este problema. Lo que sigue es la

solución que dio de él:

Sean P, Q, R, S,…los valores de las ordenadas y correspondientes a los valores

p, q, r, s,… de las abscisas x; tendremos las siguientes ecuaciones

...............................................

...,

...,

...,

32

32

32

++++=

++++=

++++=

drcrbraR

dqcqbqaQ

dpcpbpaP

El número de estas ecuaciones debe ser igual al número de coeficientes indeterminados

a, b, c,…. Sustrayendo estas ecuaciones una de la otra, los restos serán divisibles por

,pq − ,...,qr − y tendremos, después de tal división,

...,)()(

...,)()(

22

22

++++++=−−

++++++=−−

qrqrdqrcbqr

QR

pqpqdpqcbpq

PQ

Sean

,1Qpq

PQ =−−

,1Rqr

QR =−−

,...1Srs

RS =−−

Debemos encontrar, de igual manera (por resta y división), lo siguiente:

........................................................

...,)(

...,)(

11

11

++++=−−

++++=−−

qrsdcqs

RS

pqrdcpr

QR

Además, sean

,211 R

pr

QR =−−

,...211 S

qs

RS =−−

Tendremos que

...,22 +=−−

dps

RS


De esta manera, encontraremos el valor de los coeficientes a, b, c,…comenzando

con el último y, sustituyéndolos en la ecuación general

96

...,32 ++++= dxcxbxay

obtendremos, después de haber hecho las reducciones apropiadas, la fórmula

...))()(())(()( 321 +−−−+−−+−+= rxqxpxSqxpxRpxQPy ,}… (1)

que puede ser llevada hasta donde queramos.

Pero esta solución puede ser simplificada a partir de la siguiente consideración.

Debido a que y necesariamente se vuelve P, Q, R…, cuando x se vuelve p, q, r,

es fácil ver que la expresión para y será de la forma

....++++= DSCRBQAPy } (2)

donde las cantidades A, B, C,… están expresadas de tal manera en términos de x, que, al

hacer que px = , tendremos

,1=A ,0=B ,...,0=C

y al hacer que ,qx = tendremos

,0=A ,1=B ,0=C ,...,0=D

y al hacer que ,rx = similarmente tendremos

,0=A ,0=B ,1=C ,...,0=D etc.

De donde es fácil concluir que los valores de A, B, C,… deben ser de la forma

,)...)()((

)...)()((

,)...)()((

)...)()((

,)...)()((

)...)()((

srqrpr

sxqxpxC

sqrqpq

sxrxpxB

sprpqp

sxrxqxA

−−−−−−=

−−−−−−=

−−−−−−=

donde hay tantos factores en los numeradores y en los denominadores como hay puntos

dados de la curva menos uno.

La última expresión para y (véase la ecuación 2), aunque distinta en forma, es la

misma que la ecuación 1. Para mostrar esto, basta decir que los valores de las cantidades

Q1, R2, S3,… simplemente necesitan ser desarrollados y sustituidos en la ecuación 1, y

los términos acomodados con respecto a las cantidades P, Q, R,…. Pero la última

expresión para y (ecuación 2) es preferible, en parte debido a la simplicidad del análisis

de donde deriva, y en parte debido a su forma, que resulta más conveniente para la

computación.

Ahora, por medio de esta fórmula, que no es difícil reducir a una construcción

geométrica, podemos encontrar el valor de la ordenada y para cualquier abscisa x,

97

porque las ordenadas P, Q, R… para las abscisas dadas p, q, r,… son conocidas. Así, si

tenemos varios términos de cualquier serie, podemos encontrar cualquier término

intermedio que queramos; un expediente, por cierto, que es extremadamente valioso

para suplir lagunas que puedan surgir en una serie de observaciones o experimentos, o

en tablas calculadas por fórmulas o en construcciones dadas.

Si ahora esta teoría es aplicada a los dos ejemplos discutidos arriba, y a ejemplos

similares en donde tengamos errores correspondientes a diferentes suposiciones,

podemos encontrar directamente el error y que corresponde a cualquier suposición

intermedia x al considerar a las cantidades P, Q, R,…, como los errores encontrados, y a

p, q, r,…, como las suposiciones de donde éstos resultan. Pero como en estos ejemplos

la cuestión no es encontrar el error que corresponde a una suposición dada, sino la

suposición cuyo error sea cero, es evidente que la cuestión presente es la opuesta de la

precedente, y que también puede ser resuelta por la misma fórmula al tomar

recíprocamente las cantidades p, q, r,… para los errores, y las cantidades P, Q, R,…

para las suposiciones correspondientes. Entonces, x será el error para la suposición y; y,

consecuentemente, al hacer que ,0=x el valor de y será el de la suposición cuyo error

es cero.

Sean P, Q, R,… los valores de la cantidad desconocida en las diferentes

suposiciones, y p, q, r… los errores resultantes de estas suposiciones, a los que se les

dan los signos apropiados. Tendremos entonces, para el valor de la cantidad

desconocida cuyo error es cero, la expresión

...,+++ CRBQAP

en la que los valores de A, B, C,… son

...,

...,

...,

×−

×−

=

×−

×−

=

×−

×−

=

rq

q

rp

pC

qr

r

qp

pB

pr

r

pq

qA

en donde son considerados tantos factores como haya suposiciones menos uno.

edición digital para la biblioteca digital del ilce...

Documents