edición digital para la biblioteca digital del ilce...
TRANSCRIPT
2
Edición Digital para la Biblioteca Digital del ILCE
Título original: Lectures on Elementary Mathematics
© De la traducción: Emilio Méndez Pinto
Primera edición: The Open Court Publishing Company, 1898
D. R. © The Open Court Publishing Company, 1898
ISBN: 978-0-486-46281-3
Prohibida su reproducción por cualquier medio mecánico o
eléctrico sin la autorización por escrito de los coeditores.
3
LECCIÓN I
SOBRE LA ARITMÉTICA, Y EN PARTICULAR FRACCIONES
Y LOGARITMOS
La aritmética se divide en dos partes. La primera se basa en el sistema decimal de
notación, y en la manera de arreglar los caracteres numerales para que expresen
números. Esta primera parte comprende a las cuatro operaciones ordinarias de adición,
sustracción, multiplicación, y división, operaciones que, como es sabido, serían
diferentes si un sistema distinto fuese adoptado, pero no sería difícil transformar desde
un sistema a otro, si un cambio de sistemas fuera deseable.
La segunda parte es independiente del sistema de numeración. Se basa en la
consideración de cantidades y en las propiedades generales de los números. La teoría de
las fracciones, la teoría de las potencias y las raíces, la teoría de las progresiones
aritmética y geométrica, y, por último, la teoría de los logaritmos, están incluidas en
esta parte. Me propongo avanzar, aquí, con algunas observaciones y comentarios sobre
las diferentes ramas de esta parte de la aritmética, que se podría considerar como la
aritmética universal, al tener una íntima afinidad con el álgebra. Esto es porque, si en
lugar de particularizar las cantidades consideradas, y en lugar de asignarlas
numéricamente, las tratamos de un modo más bien general, designándolas con letras,
tenemos álgebra en vez de aritmética.
Ustedes saben lo que es una fracción. La noción de una fracción es ligeramente
más compuesta que la de los números enteros. En estos últimos, consideramos
solamente una cantidad repetida. Para llegar a la noción de una fracción, es necesario
considerar la cantidad dividida en un cierto número de partes. Las fracciones
representan, casi siempre, razones*, y sirven para expresar una cantidad por medio de
otra. En general, nada mensurable puede ser medido excepto por fracciones que
expresen el resultado de la medición, a menos que la medida sea contenida un número
exacto de veces en la cosa a ser medida.
* Lagrange utiliza la palabra francesa que en español significa razones para referirse a las proporciones que las fracciones representan. Llega, paulatinamente, a la noción de proporción más adelante. En español, es mucho más común la palabra proporciones que razones para referirse a esta parte de la aritmética. Sin embargo, hago la misma distinción que hace Lagrange, para permanecer fiel al texto y al sentido originales del autor. Nota del Traductor.
4
Ustedes también saben cómo una fracción puede ser reducida a sus términos más
bajos. Cuando el numerador y el denominador son - ambos - divisibles por el mismo
número, se puede encontrar su máximo común divisor a partir de un ingenioso método
que le debemos a EUCLIDES. Este método es sumamente simple y lúcido, pero puede
volverse aún más evidente a los ojos debido a la siguiente consideración. Supongamos,
por ejemplo, que nos ha sido dada una longitud, y que queremos medirla. Las unidades
para medir también nos son dadas, y queremos saber cuántas veces están éstas
contenidas en la longitud. Lo primero que se debe hacer, es agotar la unidad de medida,
tantas veces como se pueda, en la longitud dada, y eso dará un cierto número entero de
medidas. Si no queda ningún resto, la operación está terminada. Pero si sí hay un resto,
éste debe ser todavía evaluado. Si la medida es dividida en partes iguales, por ejemplo,
en diez, doce, o en más partes iguales, el procedimiento natural es usar una de estas
partes como una nueva medida y observar cuántas veces está contenida en el resto.
Tendremos entonces, para el valor de nuestro resto, una fracción cuyo numerador es el
número de partes contenida en el resto, y el denominador el número total de partes en
las cuales está dividida la medida dada. Supongamos, ahora, que nuestra medida no está
dividida así, y que aún queremos determinar la razón de la longitud propuesta a la
longitud que hemos adoptado como nuestra medida. Hablaré entonces del
procedimiento que surge de manera más natural para realizar esto.
Si tenemos un resto, como es menor que la medida, tendremos naturalmente que
buscar cuántas veces está contenido nuestro resto en la medida. Digamos que dos veces,
y que todavía queda un resto. Pongamos, entonces, este resto en el resto precedente.
Como necesariamente es más pequeño, estará contenido un cierto número de veces en el
resto precedente, digamos tres veces, y entonces puede que hay otro resto, o puede que
no; y seguimos procediendo así. En estos diferentes restos tendremos lo que se llama
una fracción continua. Por ejemplo, hemos encontrado que la medida está contenida
tres veces en la longitud propuesta. Tenemos, para empezar, el número tres. Y hemos
encontrado que el primer resto se encuentra dos veces en la medida. Tendremos
entonces la fracción uno dividido entre dos. Pero este último denominador no está
completo, porque se supone que todavía queda un resto. Este resto producirá otra
fracción similar, que debe ser añadida al último denominador, y que debe ser, a partir de
nuestra suposición, uno dividido entre tres. Y así hacemos con el resto. Tendremos, de
esta forma, la fracción
5
3 + 1
2 + 1
3 +…
como la expresión de la razón entre la longitud propuesta y la medida adoptada.
Las fracciones que tienen esta forma son llamadas fracciones continuas, y
pueden ser reducidas a fracciones ordinarias a partir de las reglas comunes. Así, si nos
detenemos en la primera fracción, es decir, si consideramos solamente al primer resto y
abandonamos el segundo, tendremos 2
13+ , que es igual a
2
7. Si consideramos
únicamente al primer y al segundo restos, nos detenemos en la segunda fracción, y
entonces tenemos .
3
12
13
++ Y .
3
7
3
12 =+ Tendremos, por lo tanto,
7
33+ , que es igual
a 7
24. Y así sucesivamente con el resto. Si llegamos, en el transcurso de nuestra
operación, a un resto que está contenido de manera exacta en el resto precedente, la
operación está terminada, y tendremos, en la fracción continua, una fracción común que
es el valor exacto de la longitud a ser medida, en términos de la longitud que sirvió
como nuestra medida. Si a partir de esto, la operación no está terminada, puede ser
continuada hasta el infinito, y entonces tendremos fracciones que se aproximarán cada
vez más y más al valor verdadero.
Si comparamos ahora este procedimiento con el empleado para encontrar el
máximo común divisor de dos números, veremos que es, virtualmente, la misma cosa;
la diferencia es que, al encontrar el máximo común divisor, dirigimos nuestra atención
solamente a los diferentes restos, de los cuales el último es el divisor buscado, mientras
que al emplear los cocientes sucesivos, como hicimos arriba, obtenemos fracciones que
se aproximan - de manera constante - cada vez más y más a la fracción formada por los
dos números dados, y de los cuales el último es la fracción en sí misma reducida a sus
términos más bajos.
Debido a que la teoría de las fracciones continuas es poco conocida, pero, no
obstante, es de gran utilidad en la solución de importantes cuestiones numéricas,
hablaremos más plenamente de la formación y propiedades de estas fracciones. Primero,
supongamos que los cocientes encontrados, ya sea por la operación mecánica, o por el
6
método de encontrar el máximo común divisor, son, como arriba, 3, 2, 3, 5, 7, 3. La
siguiente es una regla por medio de la cual podemos registrar, de una sola vez, las
fracciones convergentes que resultan de estos cocientes, sin tener que desarrollar
fracción continua alguna.
El primer cociente, suponiendo que está dividido entre la unidad, nos dará la
primera fracción, que será demasiado pequeña, a saber, .1
3 Después, al multiplicar el
numerador y el denominador de esta facción por el segundo cociente, y al añadir la
unidad al numerador, obtendremos la segunda fracción, ,2
7 que será muy grande. Al
multiplicar, de la misma manera, el numerador y el denominador de esta fracción por el
tercer cociente, y al añadir al numerador el numerador de la fracción precedente, y al
denominador el denominador de la fracción precedente, obtendremos nuestra tercera
fracción, que será demasiado pequeña. Así, si el tercer cociente es 3, tenemos para
nuestro numerador ( ) ,2432137 =+=× y para nuestro denominador ( ) .71632 =+=×
El tercer convergente, por lo tanto, es .7
24 Procedemos de la misma forma para el
cuarto convergente. Si el cuarto cociente es 5, decimos que 24 veces 5 es 120, y esto
más 7, que es el numerador de la fracción precedente, es 127; similarmente, 7 veces 5 es
35, y esto más 2 es 37. La nueva fracción, por lo tanto, es .37
127 Y así con el resto.
De esta forma, al emplear los seis cocientes 3, 2, 3, 5, 7, 3, obtenemos las seis
fracciones ,835
2866,
266
913,
37
127,
7
24,
2
7,
1
3de las cuales la última, suponiendo que la
operación debe ser completada en el sexto cociente 3, será el valor requerido de la
longitud medida, o la fracción en sí misma reducida a sus términos más bajos.
Las fracciones que precedieron a lo último son alternativamente más pequeñas y
más grandes que la última, y tienen la ventaja de aproximarse cada vez más y más a su
valor de manera tal que ninguna otra fracción puede aproximarse más cerca, excepto si
su denominador es más grande que el producto del denominador de la fracción en
cuestión y el denominador de la siguiente fracción. Por ejemplo, la fracción 7
24 es
menor que el valor verdadero de la fracción 835
2866, pero se acerca a éste de manera más
cercana de lo que lo hace cualquier otra fracción cuyo denominador no sea mayor que el
7
producto de 7 por 37, esto es, 259. Así, cualquier fracción expresada en números
grandes puede ser reducida a una serie de fracciones expresadas en números pequeños y
que se acerque lo más posible a ella en valor.
La demostración de las propiedades precedentes se deduce de la naturaleza
misma de las fracciones continuas, y del hecho de que, si buscamos la diferencia entre
una de las fracciones convergentes y la siguiente adyacente a ésta, obtendremos una
fracción de la cual el numerador será siempre la unidad y el denominador el producto de
los dos denominadores; una consecuencia que se sigue, a priori, de la misma ley de la
formación de estas fracciones. Así, la diferencia entre 2
7 y
1
3 es
2
1, en exceso; entre
7
24 y
2
7,
14
1, en defecto; entre
37
127 y
7
24,
259
1, en exceso, etc. El resultado es que, al
emplear esta serie de diferencias, podemos expresar, en una forma distinta y muy
simple, las fracciones que nos ocupan aquí, por medio de una segunda serie de
fracciones de las cuales los numeradores son todos unidad y los denominadores,
sucesivamente, los productos de cada dos denominadores adyacentes. En lugar de las
fracciones escritas arriba, tenemos entonces la serie:
.835266
1
26637
1
377
1
72
1
21
1
1
3
×+
×−
×+
×−
×+
El primer término, como podemos ver, es la primera fracción, el primero y el
segundo, juntos, dan la segunda fracción 2
7, el primero, el segundo, y el tercero, dan la
tercera fracción, 7
24, y así sucesivamente con el resto; el resultado es que la serie entera
es equivalente a la última fracción.
Existe todavía otra forma, menos conocida pero en algunos aspectos más simple,
de tratar con la misma cuestión, y que nos conduce directamente a una serie similar a la
precedente. Volviendo al ejemplo anterior, después de haber encontrado que la medida
entra tres veces en la longitud a ser medida, y que, después de que el primer resto ha
sido aplicado a la medida, hay aún un nuevo resto, en lugar de comparar este segundo
resto con el precedente, como hicimos arriba, podemos compararlo con la medida en sí
misma. Así, suponiendo que entra en esta última siete veces con un resto, comparamos
de nuevo este último resto con la medida, y así sucesivamente, hasta que lleguemos, si
es posible, a un resto que sea una parte alícuota de la medida, lo que hará que la
operación termine. Si, por el contrario, la medida y la longitud a ser medida son
8
inconmensurables, el proceso puede continuar hasta el infinito. Tenemos entonces,
como expresión de la longitud medida, la serie ...72
1
2
13 +
×−+ .
Es evidente que este método es también aplicable a las fracciones ordinarias.
Constantemente conservamos al denominador de la fracción como el dividendo, y
tomamos a los diferentes restos, de manera sucesiva, como divisores. Así, la fracción
835
2866 da los cocientes 3, 2, 7, 18, 19, 46, 119, 417, 835; de los cuales obtenemos la
serie ...;191872
1
1872
1
72
1
2
13 +
×××−
××+
×−+ y como estas fracciones parciales
disminuyen rápidamente, tendremos, al combinarlas sucesivamente, las fracciones
simples ,...,1872
865,
72
48,
2
7
××× que constantemente se acercarán, cada vez más y más, al
valor verdadero buscado, y el error será menor que con las primeras de las fracciones
parciales abandonadas.
Nuestras observaciones hechas sobre los métodos precedentes no deben
interpretarse como significando que el empleo de fracciones decimales no es siempre
preferible para expresar los valores de fracciones para cualquier grado de exactitud que
deseemos. Pero existen casos en donde es necesario que estos valores sean expresados
por la menor cantidad posible de figuras. Por ejemplo, si fuese requerido construir un
planetario, debido a que las razones de las revoluciones de los planetas de uno al otro
son expresadas por números muy grandes, sería necesario, para no multiplicar de
manera excesiva el número de dientes sobre las ruedas, aprovechar a los números
pequeños, pero, al mismo tiempo, seleccionarlos de tal forma que sus razones se
aproximen lo más posible a las razones reales. Fue, de hecho, esta cuestión la que
sugirió a HUYGENS, en su búsqueda por esta solución, el empleo de las fracciones
continuas, y de esta forma nació la teoría de estas fracciones. Tiempo después, durante
la elaboración de esta teoría, se encontró que era apta para la solución de otras
cuestiones importantes, y esta es la razón, debido a que no se encuentra en trabajos
elementales, por la que sentí necesario entrar en detalles al exponer sus principios.
Pasemos ahora a la teoría de las potencias, proporciones, y progresiones. Como
ustedes ya saben, un número multiplicado por sí mismo produce su cuadrado, y
multiplicado de nuevo por sí mismo produce su cubo, etc. En la geometría, no vamos
más allá del cubo, porque ningún cuerpo puede tener más de tres dimensiones. Pero en
9
el álgebra y en la aritmética, vamos tan lejos como queramos. Y es aquí en donde la
teoría de la extracción de raíces tiene su origen. Porque, aunque cada número puede ser
elevado a su cuadrado y a su cubo y así sucesivamente, no es verdad que,
recíprocamente, cada número sea un cuadrado exacto o un cubo exacto. El número 2,
por ejemplo, no es un cuadrado; y esto es porque el cuadrado de 1 es 1, y el cuadrado de
2 es cuatro, y como no hay otros números enteros entre estos dos, es imposible
encontrar un número entero que, multiplicado por sí mismo, dé 2. No puede tampoco
ser encontrado en las fracciones, porque si tomamos una fracción reducida a sus
términos más bajos, el cuadrado de esa fracción será de nuevo una fracción reducida a
sus términos más bajos, y, consecuentemente, no puede ser igual al número entero 2.
Pero aunque no podamos obtener la raíz cuadrada de 2 de manera exacta, sí nos
podemos acercar a ella tanto como queramos, particularmente por las fracciones
decimales. Al seguir las reglas comunes para la extracción de raíces cuadradas, raíces
cúbicas, etc., el proceso puede ser extendido al infinito, y nos podemos acercar a los
valores verdaderos de las raíces con cualquier grado de exactitud que queramos.
Pero no entraré en detalles aquí. La teoría de las potencias ha dado lugar a la de
las progresiones, y antes de entrar en ésta, son necesarias unas palabras respecto a las
proporciones.
Cada fracción expresa una razón. Si tenemos dos fracciones iguales hay, por lo
tanto, dos razones iguales; y los números que constituyen las fracciones o las razones
forman lo que se llama una proporción. De esta forma, la igualdad de los radios 2 a 4 y
3 a 6 produce la proporción 2 : 4 : : 3 : 6, porque 4 es el doble de 2 como 6 es el doble
de 3. Muchas de las reglas de la aritmética dependen de la teoría de las proporciones. En
primer lugar, es la base de la célebre regla de tres, cuyo uso es tan extensivo. Ustedes
saben que cuando los tres primeros términos de una proporción están dados, para
obtener el cuarto tenemos simplemente que multiplicar los últimos dos conjuntamente y
dividir el producto entre el primero. Se han concebido, de igual manera, varias reglas
especiales, y éstas han encontrado lugar en los libros sobre aritmética; pero todas ellas
son también reducibles a la regla de tres, e incluso pueden ser obviadas si
comprendemos a fondo las condiciones del problema. Existen reglas de tres directas,
inversas, simples, compuestas, reglas de asociación, de mezclas, etc. En todos los casos,
únicamente es necesario considerar cuidadosamente las condiciones del problema, y
acomodar correspondientemente los términos de la proporción.
10
No entraré en más detalles sobre este tema. Existe, sin embargo, otra teoría que
es útil en numerosas ocasiones, a saber, la teoría de las progresiones. Cuando se tienen
varios números que guardan la misma proporción uno con otro, y que se siguen de tal
forma que el segundo es al primero lo que el tercero al segundo, como el cuarto es al
tercero, etc., se dice que estos números forman una progresión. Empezaré con una
observación.
Los libros sobre aritmética y álgebra comúnmente suelen hacer la distinción
entre dos tipos de progresión, la aritmética y la geométrica, correspondientes a las
proporciones llamadas aritmética y geométrica. Pero la denominación de proporción me
parece extremadamente inapropiada si se aplica a la proporción aritmética. Y como es
uno de los objetivos de la École Normale† rectificar el lenguaje científico, la presente
digresión no es irrelevante.
Puedo entender, entonces, que la idea sobre la proporción está bien establecida
por el uso, y que corresponde solamente a lo que se conoce como proporción
geométrica. Cuando hablamos de la proporción de las partes del cuerpo de un hombre,
de la proporción de las partes de un edificio, cuando decimos que un plano debe ser
reducido proporcionalmente en tamaño, etc., en general, cuando decimos que una cosa
es proporcional a otra, entendemos por proporción únicamente la igualdad de las
razones, como en la proporción geométrica, y nunca igualdad de diferencias, como en la
proporción aritmética. Por lo tanto, en lugar de decir que los números 3, 5, 7, 9, están en
proporción aritmética, debido a que la diferencia entre 5 y 3 es la misma que entre 9 y 7,
estimo que es deseable que se emplee otro término, a fin de evitar cualquier
ambigüedad. Podemos llamar, por ejemplo, a tales números equi-diferentes, reservando
de esta manera el nombre de proporcionales para los números que están en proporción
geométrica, como 2, 4, 6, 8, etc.
En cuanto al resto, no puedo entender por qué la proporción llamada aritmética
es más aritmética que la que es llamada geométrica, ni por qué esta última es más
geométrica que la primera. Por el contrario, la idea primitiva de la proporción
geométrica está basada en la aritmética, porque la noción de razones surge,
esencialmente, de la consideración de los números. Aún así, mientras espero que esta
designación inapropiada sea cambiada, continuaré utilizando estos términos, debido a
cuestiones de simplicidad y conveniencia.
† La École Normale es la Escuela Normal Superior de Francia, lugar donde Lagrange dictó estas lecciones. Nota del Traductor.
11
La teoría de las progresiones aritméticas presenta algunas pocas dificultades. Las
progresiones aritméticas consisten en cantidades que se incrementan o que disminuyen,
de manera constante, por la misma cuantía. Pero la teoría de las progresiones
geométricas es más difícil y más importante, debido a que un gran número de cuestiones
interesantes dependen de ella, por ejemplo, todos los problemas del interés compuesto,
todos los problemas que se relacionan con el descuento, y muchos otros de la misma
naturaleza.
En general, las cantidades en la proporción geométrica se producen cuando una
cantidad se incrementa y la fuerza que genera este incremento, para decirlo de alguna
manera, es proporcional a esa cantidad. Se ha observado que en los países en donde los
medios para subsistir son fácilmente adquiridos, como en las primeras colonias
americanas, la población se duplica al cabo de veinte años; si es el doble al final de
veinte años, será el cuádruple al final de cuarenta, óctuple al final de sesenta, etc., y el
resultado es, como vemos, una progresión geométrica, correspondiente a intervalos de
tiempo en la progresión aritmética.‡ Sucede algo parecido con el interés compuesto. Si
una suma dada de dinero produce, a lo largo de un determinado tiempo, una cierta suma,
al final del doble del tiempo, la suma original habrá producido una suma adicional
equivalente, y después, la suma producida en el primer espacio de tiempo habrá
producido durante el segundo espacio de tiempo - de igual manera y en su proporción -
una cierta suma; y así con el resto. La suma original es comúnmente llamada la
principal, la suma producida el interés, y la razón constante de la principal al interés por
año, la tasa. Así, la tasa veinte significa que el interés es la veinteava parte del principal
(una tasa que es comúnmente llamada 5 por ciento, al ser 5 la veinteava parte de 100).
Sobre esta base, la suma principal, al final de un año, se habrá incrementado por su
vigésima parte; consecuentemente, habrá aumentado en la razón de 21 a 20. Al final de
dos años, se habrá incrementado de nuevo en la misma razón, esto es, en la razón de 20
21
multiplicada por 20
21; al final de tres años, en la razón de
20
21multiplicada dos veces por
sí misma, etc. De esta manera, podemos encontrar que al final de quince años, la suma
se habrá casi duplicado, y que al final de cincuenta y tres años se habrá incrementado
diez veces. De manera inversa, debido a que una suma pagada ahora será el doble al
‡ Resulta sumamente interesante constatar cómo el gran genio de Lagrange anticipa algunos de los principios que más tarde serán expuestos, en mayor detalle y con otros medios y fines, por Malthus en sus escritos sobre la población. Nota del Traductor.
12
final de quince años, es claro que una suma que no se paga hasta después de la
expiración de quince años, tiene ahora el valor de un medio de su cantidad. Esto es lo
que se denomina como el valor presente de una suma pagadera al final de un cierto
tiempo; y es evidente que, para encontrar su valor, solamente es necesario dividir la
suma prometida entre la fracción 20
21, o multiplicarla por la fracción
21
20, tantas veces
como existan años para ejecutar. De esta forma podemos ver que una suma pagadera al
final de cincuenta y tres años, vale en el presente solamente una décima parte. De esto
se sigue que se obtienen pocas ventajas de entregar la absoluta propiedad de una suma
de dinero para disfrutarla sólo por un periodo de, digamos, cincuenta y tres años; y esto
es porque por tal transacción ganamos solamente una décima parte en uso real, mientras
que perdemos la posesión de la propiedad para siempre.
En las anualidades, la consideración del interés se combina con el de la
probabilidad de la vida; y como cada uno es propenso a creer que va a vivir mucho
tiempo, y como, por otra parte, uno tiende a subestimar el valor de la propiedad que se
abandona al morir, surge la peculiar tentación - siempre y cuando no se tengan hijos - de
invertir la fortuna de uno, en su totalidad o en partes, en anualidades. Sin embargo,
cuando se ponen a prueba de un cálculo riguroso, las anualidades no ofrecen las
suficientes ventajas como para inducir a las personas a que sacrifiquen por ellas la
propiedad del capital original. De acuerdo con esto, siempre que se ha intentado crear
anualidades lo suficientemente atractivas como para inducir a los individuos a creer en
ellas, ha sido necesario ofrecerlas en términos que resultan onerosos o pesados para la
compañía. Pero diremos más sobre este tema cuando expongamos la teoría de las
anualidades, que es una rama del cálculo de probabilidades.
Concluiré la presente lección con unas palabras sobre los logaritmos. La idea
más simple que podemos formarnos sobre la teoría de los logaritmos, tal como se
encuentran en las tablas ordinarias, es la de concebir todos los números como potencias
de 10; los exponentes de estas potencias, por lo tanto, serán los logaritmos de los
números. De esto resulta evidente que la multiplicación y división de dos números es
reducible a la adición y sustracción de sus respectivos exponentes, esto es, de sus
logaritmos. Y, consecuentemente, la involución y la extracción de las raíces son
reducibles a la multiplicación y división, lo que representa una inmensa ventaja en la
aritmética y hace que los logaritmos tengan un incalculable valor en esa ciencia.
13
Pero en el periodo en el que los logaritmos fueron inventados, los matemáticos
no estaban en posesión de la teoría de las potencias. No sabían que la raíz de un número
pudiera ser representada por una potencia fraccionaria. Lo siguiente será una exposición
sobre cómo se acercaron al problema.
La idea primitiva era la de dos progresiones correspondientes, una aritmética, y
la otra geométrica. De esta forma, se alcanzó la noción general de un logaritmo. Pero
todavía faltaban los medios para encontrar los logaritmos de todos los números. Como
los números se siguen uno a otro en la progresión aritmética, era necesario, para que
pudieran ser encontrados entre los términos de la progresión geométrica - para
establecer aquella progresión - que sus sucesivos términos difieran el uno del otro por
cantidades extremadamente pequeñas; y, para probar la posibilidad de expresar todos
los números en esta forma, NAPIER, su inventor, los consideró primero como
expresados por líneas y por partes de líneas, y estas líneas las consideró como generadas
por el movimiento continuo de un punto, lo que era muy natural.
De acuerdo con esto, consideró dos líneas, la primera generada por el
movimiento de un punto describiendo en tiempos iguales espacios en progresión
geométrica, y la segunda generada por un punto que describía espacios que
incrementaban mientras el tiempo lo hacía, y que consecuentemente formaban una
progresión aritmética correspondiente a la progresión geométrica. Y supuso, en aras de
la simplicidad, que las velocidades iniciales de estos dos puntos eran iguales. Esto le dio
los logaritmos, primero llamados naturales, y después hiperbólicos, cuando se
descubrió que podían ser expresados como partes del área incluida entre una hipérbola y
sus asíntotas. Por este método, es evidente que para encontrar el logaritmo de cualquier
número dado, únicamente es necesario tomar una parte en la primera línea igual al
número dado, y buscar la parte en la segunda línea que haya sido descrita en el mismo
intervalo de tiempo que la parte en la primera.
Conforme a esta idea, si tomamos como los dos primeros términos de nuestra
progresión geométrica los números con las muy pequeñas diferencias 1 y 1.0000001, y
como aquellos de nuestra progresión aritmética a 0 y 0.0000001, y si buscamos de
manera sucesiva - por las reglas conocidas - todos los términos siguientes de las dos
progresiones, encontraremos que el número 2 - expresado aproximadamente al octavo
lugar de los decimales - es el término 6931472 de la progresión geométrica, esto es, que
el logaritmo de 2 es 0.6931472. El número 10 es el término 23025851 de la misma
progresión; por lo tanto, el logaritmo de 10 es 2.3025851, y así con el resto. Pero
14
NAPIER, teniendo que determinar solamente los logaritmos de números menores que la
unidad para los propósitos de la trigonometría, donde los senos y los cosenos de los
ángulos son expresados como fracciones del radio, consideró una progresión geométrica
decreciente, de la cual los primeros dos términos eran 1 y 0.9999999; y, a partir de esta
progresión, determinó los términos sucesivos con computaciones enormes. En esta
última hipótesis, el logaritmo que hemos encontrado para 2 se convierte en el número
2
1 ó 0.5, y el del número 10 se convierte en el número
10
1 ó 0.1; como es evidente dada
la naturaleza de las dos progresiones.
El trabajo de NAPIER apareció en 1614, y su utilidad se percibió de inmediato.
Pero también se percibió de inmediato que se ajustaría mejor al sistema decimal de
nuestra aritmética, y que por lo tanto sería más simple, si el logaritmo de 10 fuese hecho
unidad, conforme a lo cual el de 100 fuese 2, y así con el resto. Para lograr ese fin, en
lugar de tomar como los primeros dos términos de nuestra progresión geométrica a los
números 1 y 0.0000001, debemos tomar los números 1 y 1.0000002302, manteniendo a
0 y 0.0000001 como los términos correspondientes de la progresión aritmética. Por
consiguiente, se verá que, mientras que el punto que está supuesto para generar - debido
a su movimiento - la línea geométrica, o los números, está describiendo la sumamente
pequeña porción de 0.0000002302…, el otro punto - que tiene la tarea de generar
simultáneamente la línea aritmética - habrá descrito la porción 0.0000001; y que, por lo
tanto, los espacios descritos en el mismo tiempo por los dos puntos al principio de su
movimiento, es decir, sus velocidades iniciales, en lugar de ser iguales (como en el
sistema precedente), serán en la proporción de los números 2.302… a 1, donde debe
observarse que el número 2.302… es exactamente el número que en el sistema original
de los logaritmos naturales representaba el logaritmo de 10 - un resultado demostrable a
priori , como veremos cuando apliquemos las fórmulas del álgebra a la teoría de los
logaritmos. BRIGGS, un contemporáneo de NAPIER, es el autor de este cambio en el
sistema de logaritmos, y también lo es de las tablas de logaritmos que se usan
comúnmente. Una porción de éstas fue calculada por BRIGGS, y la otra por VLACQ,
en Holanda.
Estas tablas aparecieron en Gouda, en 1628. Ellas contienen los logaritmos de
todos los números del 1 al 100000 para diez lugares decimales, y son, hoy en día,
sumamente raras. Pero después se descubrió que, para propósitos ordinarios, siete
decimales eran suficientes, y los logaritmos se encuentran en esta forma en las tablas
15
que se utilizan hoy en día. BRIGGS y VLACQ emplearon un número de artificios
sumamente ingeniosos para facilitar su trabajo. El recurso que se ofreció de manera más
natural y que es también uno de los más simples, consiste en tomar los números 1, 10,
100,…, de los cuales los logaritmos son 0, 1, 2,…, e interpolar, entre los términos
sucesivos de estas dos series, tantos términos correspondientes como queramos, en la
primera serie por medios proporcionales geométricos, y en la segunda por medios
aritméticos. De esta manera, cuando hemos llegado a un término en la primera serie que
se aproxima al octavo lugar decimal - el número cuyo logaritmo buscamos -, el término
correspondiente de la otra serie será, aproximadamente para el octavo lugar decimal, el
logaritmo de ese número. Así, para obtener el logaritmo de 2, como 2 yace entre 1 y 10,
buscamos primero, por la extracción de la raíz cuadrada de 10, la media geométrica
entre 1 y 10, que es 3.16227766, mientras que la correspondiente media aritmética entre
0 y 1 es 2
1 ó 0.50000000; de esta forma, estamos seguros que este último número es el
logaritmo del primero. De nuevo, como 2 yace entre 1 y 3.16227766, el número que
acabamos de encontrar, buscamos de la misma manera la media geométrica entre estos
dos números, y encontramos que es el número 1.77827941. Como antes, tomando la
media aritmética entre 0 y 0.50000000, tendremos para el logaritmo de 1.77827941 el
número 0.25000000. De nuevo, como 2 se encuentra entre 1.77827941 y 3.16227766,
será necesario, para seguir aproximándonos, encontrar la media geométrica entre estos
dos números, y, de igual forma, la media aritmética entre sus logaritmos. Y así
sucesivamente. De esta manera, por un gran número de operaciones similares,
encontramos que el logaritmo de 2 es 0.3010300, que el de 3 es 0.4771213, etc., sin
tener un grado de exactitud más allá del séptimo lugar decimal. Aún así, el cálculo
precedente es necesario solamente para los números primos, porque los logaritmos de
los números que son el producto de dos o más números, pueden ser encontrados al
considerar la suma de los logaritmos de sus factores.
En cuanto al resto, debido a que el cálculo de logaritmos es ahora una cosa del
pasado, excepto en casos aislados, podría pensarse que los detalles en los que hemos
entrado carecen de valor. Podemos, sin embargo y con justicia, ser lo suficientemente
curiosos para conocer los tortuosos y agotadores caminos por los que los grandes
inventores han pasado, los diferentes pasos que han recorrido para llegar a sus fines, y el
grado en el que estamos en deuda con estos verdaderos benefactores de la humanidad.
Este conocimiento, por otra parte, no es simplemente una curiosidad ociosa. Puede
16
proporcionarnos una guía para investigaciones similares, y arroja una luz creciente
sobre los temas que ahora nos ocupan.
Los logaritmos son un instrumento universalmente empleado en las ciencias, y
en las artes que dependen del cálculo. El siguiente ejemplo constituye una evidente
aplicación de su uso.
Las personas que no son totalmente ignorantes en temas musicales saben que las
distintas notas de una octava son expresadas por números que dan las divisiones de una
cuerda estirada produciendo aquellas notas. Así, la nota principal está denotada por 1, su
octava por 2
1, su quinta por
3
2, su tercera por
5
4, su cuarta por
4
3, su segunda por
9
8,
etc. La distancia de una de estas notas a la siguiente adyacente se llama intervalo, y es
medido, no por la diferencia, sino por la razón de los números expresando los dos
sonidos. Así, el intervalo entre la cuarta y la quinta, que es llamado el tono mayor, está
considerado como doblemente sensible que el que está entre la tercera y la cuarta, que
es llamado el semi-mayor. De hecho, si la primera está expresada por 9
8, y la segunda
por 16
15, se verá que la primera no difiere por mucho del cuadrado de la segunda. Ahora,
es claro que esta concepción sobre los intervalos, sobre los cuales se funda toda la teoría
del temperamento, nos conduce naturalmente a los logaritmos. Porque si expresamos el
valor de las distintas notas por los logaritmos de las longitudes de las cuerdas que
responden a ellas, entonces el intervalo de una nota a otra será expresado por la simple
diferencia de valores de las dos notas; y si fuese requerido dividir la octava en doce
semi-tonos iguales - lo que produciría el temperamento más exacto y simple -
simplemente tendríamos que dividir el logaritmo de una mitad, el valor de la octava, en
doce partes iguales.
17
LECCIÓN II
SOBRE LAS OPERACIONES DE LA ARITMÉTICA
Un antiguo prosista alguna vez dijo que la aritmética y la geometría eran las alas
de las matemáticas. Creo que podemos decir, sin recurrir a metáforas, que estas dos
ciencias son el fundamento y la esencia de todas las ciencias que traten con la magnitud.
Pero no solamente son el fundamento, sino son también, por decirlo de alguna manera,
la piedra angular de estas ciencias. Porque, cuando hemos llegado a un resultado, para
poder hacer uso de él, es un requisito que sea puesto o traducido en números o en líneas;
para traducirlo en números, es necesaria la aritmética; para traducirlo en líneas, tenemos
que recurrir a la geometría.
De acuerdo con esto, la importancia de la aritmética me conduce a una discusión
complementaria sobre el tema hoy en día, aunque hayamos empezado con el álgebra.
Voy a asumir sus diversas partes y a ofrecer nuevas observaciones que servirán para
complementar lo que ya he expuesto a ustedes. Por otra parte, cuando sea necesario haré
uso del cálculo geométrico, con el fin de dar mayor generalidad a las demostraciones y a
los métodos.
Primero, en lo que concierne a la adición, no hay nada nuevo que decir sobre lo
que ya se ha dicho hasta ahora. La adición es una operación tan simple que su concepto
es una cuestión de rutina. Pero en lo que concierne a la sustracción, existe otra forma de
llevar a cabo esta operación, que es frecuentemente más ventajosa que la del método
común, particularmente para aquellos familiarizados con él. Consiste en convertir la
sustracción en adición al tomar el complemento de cada figura del número que vaya a
ser sustraído, primero con respecto a 10, y después con respecto a 9. Supongamos, por
ejemplo, que el número 2635 debe ser sustraído del número 7853.
2635
7853
5218
En lugar de decir que 5 de 13 deja 8; 3 de 4 deja 1; 6 de 8 deja 2; y 2 de 7 deja 5, dando
un remanente total de 5218, yo digo: 5 el complemento de 5 con respecto a 10 añadido a
3 da 8, y escribo 8; 6 el complemento de 3 con respecto a 9 añadido a 5 da 11, y escribo
1 y llevo 1; 3 el complemento de 6 con respecto a 9, más 9, por razón del 1 llevado, da
18
12, y escribo 2 y llevo 1; por último, 7 el complemento de 2 con respecto a 9 más 8, a
cuenta del 1 llevado, da 15, y escribo 5 y esta vez no llevo nada, porque la operación
está completa, y el 10 que fue tomado en préstamo a lo largo de la operación debe ser
rechazado. De esta manera, obtenemos el mismo remanente que arriba, 5218.
El método precedente es extremadamente conveniente cuando los números son
grandes, porque en el método común de sustracción, donde el préstamo es necesario al
sustraer números simples unos de otros, los errores suelen ser muy comunes, mientras
que en el método que nos concierne - y en donde la sustracción se convierte en adición -
nunca tomamos prestados números, sino simplemente los llevamos. En cuanto a los
complementos, suelen ser detectables a simple vista, porque cualquiera sabe que 3 es el
complemento de 7 con respecto a 10, 4 es el complemento de 5 con respecto a 9, etc. Y
en cuanto a la razón de este método, también la causa es muy palpable. Los distintos
complementos, tomados juntos, forman el complemento total del número a ser
sustraído, ya sea con respecto a 10, ó a 100, ó a 1000, etc., dependiendo de si el número
tiene 1, 2, 3… figuras; de manera que la operación realizada es virtualmente equivalente
a primeramente añadir 10, 100, 1000… al minuendo y después tomar el sustraendo del
minuendo así aumentado. Por esto, es igualmente manifiesto por qué el 10 de la suma
encontrada por la última adición parcial debe ser rechazado.
En lo que se refiere a la multiplicación, existen varios métodos abreviados,
basados en el sistema decimal de los números. Al multiplicar por 10, por ejemplo,
simplemente tenemos que añadir una cifra; al multiplicar por 100 tenemos que añadir
dos cifras; por 1000, tres cifras, etc. Consecuentemente, para multiplicar por cualquier
parte alícuota de 10, por ejemplo 5, tenemos que multiplicar por 10 y después dividir
entre 2; para multiplicar por 25, multiplicamos por 100 y dividimos entre 4, y así
sucesivamente para todos los productos de 5.
Cuando los números decimales son multiplicados por números decimales, la
regla general consiste en considerar a los dos números como enteros y, cuando la
operación está terminada, marcar - de derecha a izquierda - tantos lugares en el producto
como haya lugares decimales conjuntamente en el multiplicador y en el multiplicando.
Pero en la práctica, esta regla se encuentra frecuentemente afectada por la
inconveniencia de alargar innecesariamente la operación, porque cuando tenemos
números que contienen decimales, aquellos son ordinariamente exactos sólo a un cierto
número de lugares, por lo cual es necesario conservar en el producto sólo los lugares
decimales de un orden equivalente. Por ejemplo, si el multiplicando y el multiplicador
19
contienen - cada uno de ellos - dos lugares de decimales, y son exactos sólo en dos
lugares decimales, debemos tener en el producto - por el método ordinario - cuatro
lugares decimales, de los cuales debemos rechazar los últimos dos, al ser inútiles e
inexactos. Proporcionaré ahora un método para obtener, en el producto, solamente
tantos lugares decimales como se desee.
Primero, hay que observar que en el método ordinario de multiplicar,
empezamos con las unidades del multiplicador que multiplicamos con las unidades del
multiplicando, y así continuamos de derecha a izquierda. Pero no hay nada que nos
obligue a empezar en la derecha del multiplicador, y podríamos empezar, igualmente
bien, por la izquierda. Y en verdad no puedo comprender por qué no es preferible este
último método, ya que posee las ventajas de dar - de una sola vez - las figuras que
tienen el valor más grande, y, en la mayoría de los casos en donde multiplicamos
números grandes, son estos últimos y más altos lugares los que nos conciernen; de
hecho, frecuentemente realizamos multiplicaciones sólo para encontrar estas últimas
figuras. Y aquí, y esto debe ser remarcado entre paréntesis, yace una de las grandes
ventajas de calcular con logaritmos, que siempre dan, ya sea en la multiplicación o en la
división, en la involución o en la evolución, las figuras en el orden descendente de su
valor, comenzando con los más altos y procediendo de izquierda a derecha.
Al realizar la multiplicación de esta manera, el producto total no se ve afectado.
La única distinción es que, por el nuevo método, la primera línea, el primer producto
parcial, es lo que en el método ordinario está al último, y el segundo producto parcial es
lo que en el método ordinario está junto al último, y así con el resto.
Cuando se trata con números enteros y se requiere el producto exacto, da igual
qué método empleemos. Pero cuando se trata con lugares decimales, lo principal es
tener primero las figuras de los números enteros en el producto, y descender después
sucesivamente a las figuras de las partes decimales, en lugar de, como en el método
ordinario, empezar con los últimos lugares decimales y ascender después sucesivamente
a las figuras que forman los números enteros.
Al aplicar este método en la práctica, escribimos el multiplicador por debajo del
multiplicando, a fin de que la figura de la unidad del multiplicador caiga por debajo de
la última figura del multiplicando. Entonces empezamos con la última figura en la
izquierda del multiplicador, que multiplicamos, como en el método ordinario, por todas
las figuras del multiplicando, empezando con la última de la derecha y procediendo
sucesivamente hacia la izquierda, y observando que la primera figura del producto debe
20
ser puesta por debajo de la figura con la que estamos multiplicando, mientras que las
otras siguen en su orden sucesivo hacia la izquierda. Procedemos de la misma forma
con la segunda figura del multiplicador, poniendo igualmente bajo esta figura la primera
figura del producto, y así con el resto. El lugar del punto decimal en estos diferentes
productos será el mismo que en el del multiplicando, es decir, todas las unidades de los
productos caerán en la misma línea vertical con aquellas del multiplicando, y, por
consiguiente, aquellas unidades de la suma de todos los productos o del producto total,
también caerán en esa línea. De esta forma, es fácil calcular tantos lugares decimales
como queramos. Daré un ejemplo de este método, en el cual el multiplicando es 437.25,
y el multiplicador 27.34:
437.25
27.34
8745 0
3060 75
131 17 5
17 49 00
11954 41 50
He escrito todos los decimales en el producto, pero es fácil ver cómo podemos
omitir calcular los decimales que queremos rechazar. La línea vertical es usada para
marcar distintivamente el lugar del punto decimal. La regla precedente me parece más
simple y natural que la que es atribuida a OUGHTRED§ y que consiste en escribir el
multiplicador por debajo del multiplicando en el orden inverso.
Finalmente, hay otra cuestión que merece ser considerada en conexión con la
multiplicación de números que contienen decimales, y es el que se refiere a que
podemos alterar, a conveniencia, el lugar del punto decimal de cada número. Porque, al
observar que el mover el punto decimal de derecha a izquierda en uno de los números,
es equivalente a multiplicar el número por 10, ó por 100, ó por 1000…, y que el mover
el punto decimal en el otro número el mismo número de lugares de izquierda a derecha
es equivalente a dividir ese número entre 10, 100, ó 1000,…, se sigue que podemos
§ Lagrange se refiere a William Oughtred (1574-1660), un ministro anglicano y matemático inglés. Nota del Traductor.
21
“empujar” el punto decimal hacia delante en uno de los números tantas veces como
queramos, siempre que lo movamos hacia el otro lado en el otro número el mismo
número de lugares, sin alterar de ninguna manera el producto. De esta forma, podemos
hacer que uno de los dos números no contenga decimales, lo que simplifica mucho la
cuestión.
La división es susceptible de una simplificación parecida, porque como el
cociente no se ve alterado al multiplicar o dividir el dividendo y el divisor por el mismo
número, se sigue que en la división podemos mover el punto decimal de ambos números
hacia delante o hacia atrás tantos lugares como queramos, siempre y cuando lo
movamos en la misma distancia en cada caso. Por consiguiente, siempre podemos
reducir el divisor a un número entero, lo que facilita infinitamente la operación, porque
cuando hay lugares decimales solamente en el dividendo, podemos proceder con la
división por el método común y rechazar todos los lugares que dan decimales de un
orden más bajo de los que queremos tomar en cuenta.
Ustedes saben cuál es la propiedad singular del número 9, por la cual si un
número es divisible por 9, la suma de sus dígitos es también divisible por nueve. Esta
propiedad nos permite saber, de manera inmediata, no solamente si un número es
divisible por 9, sino también cuál es el resto de tal división. Porque solamente tenemos
que tomar la suma de sus dígitos y dividir esa suma entre 9, y el resto será el mismo que
el del número original dividido entre 9.
La demostración de la proposición precedente no es difícil. Descansa sobre el
hecho de que los números 10 menos 1, 100 menos 1, 1000 menos 1,…son todos
divisibles entre 9, y es muy obvio que los números resultantes son 9, 99, 999,….
Si, ahora, sustraemos de un número dado la suma de todos sus dígitos,
tendremos como nuestro resto al dígito de las decenas multiplicado por 9, al dígito de
los cientos multiplicado por 99, al dígito de los miles multiplicado por 999, etc., un
resto que es plenamente divisible entre 9. Consecuentemente, si la suma de los dígitos
es divisible por 9, el número original en sí mismo será también divisible, y si no es
divisible por 9, de igual manera el número original tampoco lo será. Pero el resto en un
caso será el mismo que en el otro.
En lo que respecta al número 9, es evidente que 10 menos 1, 100 menos 1,… son
divisibles entre 9; pero el álgebra demuestra que la propiedad en cuestión se mantiene
para cada número a. Porque se puede ver que
22
,...1,1,1,1 432 −−−− aaaa
son todas cantidades divisibles por 1−a , y la división real dando los cocientes
,...1,1,1,1 232 ++++++ aaaaaa
La conclusión es por lo tanto obvia, y es que la propiedad mencionada del
número 9 se mantiene en nuestro sistema decimal aritmético porque 9 es 10 menos 1, y
que en cualquier otro sistema fundado en la progresión ,...,, 32 aaa el número 1−a
tendría la misma propiedad. Así, en un sistema duodecimal, sería el número 11; y en
este sistema cada número, la suma de cuyos dígitos fuese divisible entre 11, también
sería en sí mismo divisible por ese número.
Como se verá ahora, la propiedad precedente del número 9 admite ciertas
generalizaciones. Debido a que cada número en nuestro sistema está representado por la
suma de ciertos términos de la progresión 1, 10, 100, 1000,…, y cada uno multiplicado
por uno de los nueve dígitos 1, 2, 3, 4,…9, es fácil ver que el resto que resulta de la
división de cualquier número por un divisor dado, será igual a la suma de los restos que
resulten de la división de los términos 1, 10, 100, 1000,…, por ese divisor, y cada uno
multiplicado por el dígito que muestra cuántas veces ha sido tomado el término
correspondiente. Por lo tanto, y de manera general, si llamamos al divisor dado D, y si
m, n, p,…, son los restos de la división de los números 1, 10, 100, 1000,…, por D, el
resto de la división de cualquier número N - del cual los caracteres que proceden de
derecha a izquierda son a, b, c,…, - por D, será obviamente igual a
m a + n b + p c…
De acuerdo con esto, si para un divisor dado D conocemos los restos m, n, p,…,
que dependen únicamente de ese divisor, y que son siempre los mismos para el mismo
divisor, solamente tenemos que escribir los restos por debajo del número original,
procediendo de derecha a izquierda, y después encontrar los diferentes productos de
cada dígito del número por el dígito que está debajo de él. La suma de todos estos
productos será el resto total resultante de la división del número propuesto por el mismo
divisor D. Y si la suma encontrada es mayor que D, podemos proceder de la misma
forma para encontrar el resto de la división por D, y así sucesivamente, hasta que
finalmente lleguemos a un resto que sea menor que D, y que será el resto que realmente
buscamos. Se sigue de esto que el número propuesto no puede ser exactamente divisible
por el divisor dado, a menos que el último resto encontrado a partir de este método sea
cero.
23
Los restos resultantes de la división de los términos 1, 10, 100,…1000, por 9,
serán siempre unidad. Por lo tanto, la suma de los dígitos de cualquier número es el
resto resultante de la división de ese número entre 9. Los restos resultantes de la
división de los mismos términos por 8 son 1, 2, 4, 0, 0, 0,… Debemos obtener, según
esto, el resto resultante de dividir cualquier número por 8, al tomar la suma del primer
dígito a la derecha, el siguiente dígito siguiente al mismo, a la izquierda multiplicado
por 2, y el tercer dígito multiplicado por 4.
Los restos que resultan de la división de los términos 1, 10, 100, 1000,…por 7
son 1, 3, 2, 6, 4, 5, 1, 3,…, en donde los mismos restos se repiten continuamente en el
mismo orden. Si ahora tenemos al número 13527541 dividido por 7, lo escribimos, por
tanto, con los restos de arriba por debajo de él:
13527541
31546231
1
12
10
42
8
25
3
3
104
231
4
0
2
6
Al tomar los productos parciales y añadirlos, obtenemos el número 104, que
sería el resto de la división del número dado por 7, si no fuese más grande que el
divisor. Tenemos entonces que repetir la operación con este resto, y encontramos que el
número de nuestro segundo resto es 6, que es el resto que realmente buscamos.
Tenemos que remarcar todavía, con respecto a los restos precedentes y a las
multiplicaciones que resultan de ellos, que pueden ser simplificados al introducir restos
24
negativos en el lugar de los restos que son mayores que la mitad del divisor, y para
hacer esto, simplemente tenemos que sustraer el divisor de cada uno de tales restos. Así,
obtenemos, en lugar de los restos 6, 5, 4, los siguientes:
.3,2,1 −−−
Los restos para el divisor 7 son, de acuerdo con esto,
,...3,1,2,3,1,2,3,1 −−−
y así hasta el infinito.
Entonces, el ejemplo precedente toma la siguiente forma:
13527541
31 231 231
7 1
6 12
10 10
23 3
3
29
sustraer 23
6
He puesto una barra debajo de los dígitos que tienen que ser considerados como
negativos, y he sustraído la suma de los productos de estos números por los de arriba, de
la suma de los otros productos.
Por lo tanto, toda la cuestión se resuelve si encontramos, para cada divisor, los
restos resultantes de dividir 1, 10, 100, 1000, por ese divisor. Esto se puede hacer pronto
a partir de una división efectiva, pero se hace más simple a partir de la siguiente
consideración. Si r es el resto de la división de 10 por un divisor dado, r2 será el resto de
la división de 100, el cuadrado de 10, por ese divisor; y, consecuentemente, será
necesario simplemente sustraer el divisor dado de r2 tantas veces como sea necesario
para obtener un resto - positivo o negativo - que sea menor que la mitad de ese divisor.
25
Dejemos que s sea ese resto; tenemos entonces simplemente que multiplicar s por r, el
resto de la división de 10, para obtener el resto de la división de 1000 por el divisor
dado, porque 1000 es 10100× , y así sucesivamente.
Por ejemplo, al dividir 10 por 7, tenemos un resto de 3; por lo tanto, el resto de
dividir 100 por 7 será 9, o, sustrayendo de 9 el divisor dado 7, 2. El resto de dividir
1000 por 7 será, entonces, el producto de 3 por 2, ó 6, o, sustrayendo el divisor, 7, 1− .
De nuevo, el resto de dividir 10,000 por 7 será el producto de 1− y 3, ó 3− , etc.
Tomemos ahora el divisor 11. El resto de dividir 1 entre 11 es 1, de dividir 10
entre 11 es 10, o, sustrayendo el divisor, .1− El resto de dividir 100 por 11 será,
entonces, el cuadrado de 1− , ó 1; de dividir 1000 por 11 será 1 multiplicado por 1− , ó
1− otra vez, y así por siempre, los restos forman la serie
,...1,1,1,1,1,1 −−−
Por lo tanto, resulta la remarcable propiedad del número 11, a saber, que si los
dígitos de cualquier número son añadidos y sustraídos de manera alternativa, esto es, si
tomamos la suma del primero, del tercero, del quinto, etc., y sustraemos de ella la suma
del segundo, del cuarto, del sexto, etc., debemos obtener el resto que resulta de dividir
ese número por el número 11.
La teoría de los restos expuesta está llena de consecuencias notables, y ha dado
lugar a todo tipo de investigaciones ingeniosas y difíciles. Podemos demostrar, por
ejemplo, que si el divisor es un número primo, los restos de cualquier progresión 1, a,
a2, a3, a4,…, forman periodos que se repetirán de manera continua hasta el infinito, y
que todos los cuales, como el primero, comienzan con unidad, de tal manera que cuando
la unidad aparece entre los restos, podemos continuarlos al infinito simplemente
repitiendo los restos que precedieron. También se ha demostrado que estos periodos
pueden solamente contener un número de términos que es igual al divisor menos 1, o a
una parte alícuota del divisor menos 1. Pero todavía no hemos sido capaces de
determinar a priori este número para cualquier divisor.
En cuanto a la utilidad de este método para encontrar el resto resultante de
dividir un número dado por un divisor dado, basta decir que es sumamente útil cuando
tenemos varios números a ser divididos por el mismo número, y que es necesario para
preparar una tabla de los restos. Dado que la división por 9 y 11 es muy simple, se
puede utilizar como una comprobación de la multiplicación y la división. Habiendo
encontrado los restos de dividir el multiplicando y el multiplicador por cualquiera de
26
estos números, es necesario simplemente tomar el producto de los dos restos así
resultantes, de los cuales, después de sustraer el divisor tantas veces como sea necesario,
debemos obtener el resto de dividir su producto por el divisor dado - un resto que debe
coincidir con el resto obtenido de tratar o considerar al producto real de esta manera -. Y
como en la división el dividendo menos el resto debe ser igual al producto del divisor y
el cociente, la misma comprobación puede resultar ventajosa aquí.
La suposición que acabo de hacer, esto es, que el producto de los restos de
dividir dos números por el mismo divisor es igual al resto de dividir el producto de estos
números por el mismo divisor, se puede probar fácilmente, y daré una demostración
general de ello.
Dejemos que M y N sean dos números, D el divisor, p y q los cocientes, y r, s los
dos restos. Tenemos claramente que
M = pD + r, N = qD + s,
de lo cual, al multiplicar, obtenemos
MN = pqD2 + spD + rqD + rs;
donde se ve claramente que todos los términos son divisibles por D, con la excepción
del último, rs, de donde se sigue que rs será el resto de dividir MN por D. Es también
evidente que si cualquier múltiplo de D, como mD, es sustraído de rs, el resultado de
mDrs − será también el resto de dividir MN por D. Porque, poniendo el valor de MN de
la siguiente forma:
mDrsmDrqDspDpqD −++++2 ,
resulta obvio que los términos restantes son todos divisibles entre D. Y este resto,
mDrs − , siempre se puede hacer menor que D, e incluso, al emplear restos negativos,
menor que .2
D
Esto es todo lo que tengo que decir sobre la multiplicación y la división. No voy
a hablar de la extracción de raíces. La regla es muy simple para las raíces cuadradas y,
al conducirnos directamente a nuestra meta, las pruebas son innecesarias. En cuanto a
los cubos y a raíces más grandes, rara vez surge la ocasión de tener que extraerlas, y,
cuando surge, la extracción puede ser realizada fácilmente por medio de los logaritmos,
y en donde el grado de exactitud puede ser llevado a tantos lugares decimales como los
logaritmos en sí mismos tengan lugares decimales. Así, con logaritmos de siete lugares,
podemos extraer raíces que tengan siete figuras, y con las grandes tablas en donde los
27
logaritmos han sido calculados en diez lugares decimales, podemos obtener diez figuras
del resultado.
Una de las operaciones más importantes de la aritmética es la llamada regla de
tres, que consiste en encontrar el cuarto término de una proporción en la cual los tres
primeros términos nos son dados.
En los libros de texto comunes sobre aritmética esta regla se ha vuelto
innecesariamente complicada, habiendo sido dividida en reglas de tres simples, directas,
inversas, y compuestas. En general, es suficiente con comprender las condiciones del
problema a fondo, porque la regla de tres común resulta siempre aplicable cuando una
cantidad aumenta o disminuye en la misma proporción que otra. Por ejemplo, el precio
de las cosas aumenta en proporción a la cantidad de las cosas, de manera que si la
cantidad de la cosa es duplicada, el precio también será duplicado, y así sucesivamente.
De manera similar, la cantidad de trabajo hecho se incrementa proporcionalmente al
número de personas empleadas. De nuevo, las cosas se pueden incrementar,
simultáneamente, en dos proporciones diferentes. Por ejemplo, la cantidad de trabajo
hecho se incrementa con el número de personas empleadas, y también con el tiempo
durante el cual están empleadas. Además, también hay cosas que disminuyen mientras
otras aumentan.
Todo esto puede ser abarcado por una única y simple proposición. Si una
cantidad incrementa tanto en la razón en la cual una o varias otras cantidades
incrementan, como en la razón en la cual una o varias otras cantidades disminuyen, esto
es lo mismo a decir que la cantidad propuesta se incrementa proporcionalmente al
producto de las cantidades que se incrementan con ella, dividido por el producto de las
cantidades que simultáneamente disminuyen. Por ejemplo, debido a que la cantidad de
trabajo hecho se incrementa proporcionalmente con el número de trabajadores y con el
tiempo durante el cual trabajan, y como disminuye en proporción a medida que el
trabajo se vuelve más difícil, podemos decir que el resultado es proporcional al número
de trabajadores multiplicado por el número encargado de medir el tiempo durante el
cual trabajaron, dividido por el número que mide o expresa la dificultad del trabajo.
El siguiente hecho no debe hacer perder de vista que la regla de tres es
propiamente aplicable sólo a cosas que se incrementan en una razón constante. Por
ejemplo, se asume que si un hombre hace una cierta cantidad de trabajo en un día, dos
hombres harán lo doble en un día, tres hombres el triple, cuatro hombres el cuádruple,
28
etc. En realidad, este no es el caso, pero en la regla de proporción se asume que es así,
porque de otro modo nos sería imposible utilizarla.
Cuando la ley del incremento o de la disminución varía, la regla de tres no es
aplicable, y los métodos ordinarios de la aritmética resultan insuficientes. Tenemos
entonces que recurrir al álgebra. Un barril de cierta capacidad se vacía en un cierto
tiempo. Sería un error concluir, a partir de esto, que un barril con el doble de capacidad
se vaciará en el doble de tiempo, porque en realidad se vaciaría en un tiempo mucho
más corto. La ley de los flujos de salida no sigue una razón constante, sino una razón
variable, que disminuye con la cantidad de líquido restante en el barril.
Sabemos por la mecánica que los espacios recorridos por un cuerpo en
movimiento uniforme guardan una razón constante con el tiempo transcurrido. Si
viajamos un kilómetro en una hora, en dos horas habremos viajado dos kilómetros. Pero
los espacios recorridos por una piedra que cae no guardan una razón fija con el tiempo.
Si cae dieciséis metros en el primer segundo, caerá cuarenta y ocho metros en el
segundo (siguiente) segundo.
La regla de tres es aplicable solamente cuando las razones son constantes. Y, en
la mayoría de las cuestiones de la vida ordinaria, las razones constantes son la regla. En
general, el precio es siempre proporcional a la cantidad, de tal forma que si una cosa
dada tiene un cierto valor, dos tales cosas tendrán el doble de valor, tres tres veces ese
valor, cuatro cuatro veces ese valor, etc. Sucede lo mismo con el producto del trabajo
relativo al número de trabajadores y a la duración del trabajo. Sin embargo, existen
casos en donde somos conducidos al error fácilmente. Si dos caballos, por ejemplo,
jalan una carga de un peso determinado, es natural suponer que cuatro caballos podrían
jalar una carga del doble de peso, y seis caballos una carga del triple de peso. Sin
embargo, estrictamente hablando, tal no es el caso. Porque la inferencia está basada en
la suposición de que cuatro caballos jalan igual en cantidad y dirección, lo que en la
práctica seguramente no sería el caso. Da la casualidad de que frecuentemente llevamos
nuestros cálculos a resultados que divergen ampliamente de la realidad. Pero la culpa no
es de las matemáticas; porque las matemáticas siempre nos devuelven exactamente lo
que hemos puesto en ellas. La razón (proporción), de acuerdo a la suposición, era
constante. El resultado está fundado en esa suposición; si la suposición es falsa, el
resultado es necesariamente falso. Siempre que se ha querido acusar a las matemáticas
de cierta inexactitud, ha sido porque los acusadores han atribuido a las matemáticas el
29
error del calculador. Si éste utiliza datos falsos o inexactos, el resultado será
necesariamente falso o inexacto.
De entre las otras reglas de la aritmética, existe una llamada aligación, que
merece una consideración especial debido a las numerosas aplicaciones que tiene.
Aunque la aligación se usa principalmente al mezclar metales por fusión, es también
aplicada a mezclas de cualquier número de artículos con diferentes valores que deban
ser combinados en un todo con un número igual de partes que tengan un valor medio.
La regla de la aligación, o de las mezclas, tiene dos partes.
En una, buscamos el valor medio y común de cada parte de la mezcla, habiendo
dado el número de las partes y el valor particular de cada una de ellas. En la segunda,
habiendo dado el número total de las partes y de su valor medio, buscamos la
composición de la mezcla en sí misma, o el número proporcional de partes de cada
ingrediente que debe ser mezclado o aligado conjuntamente.
Supongamos, por ejemplo, que tenemos varios bushels** de grano de diferentes
precios, y que queremos saber el precio medio. El precio medio debe ser tal que si cada
bushel fuese de ese precio, el precio total de todos los bushels juntos seguiría siendo el
mismo. Por lo cual es fácil ver que para encontrar el precio medio en el presente caso,
tenemos simplemente que encontrar el precio total y dividirlo por el número de bushels.
Por lo general, si multiplicamos el número de cosas de cada tipo por el valor de
la unidad de ese tipo, y luego dividimos la suma de todos estos productos por (entre) el
número total de cosas, obtendremos el valor medio, porque este valor multiplicado por
el número de cosas producirá el valor total de todas las cosas tomadas conjuntamente.
Este valor medio o valor promedio, como también es llamado, es de gran utilidad para
casi todos los asuntos de la vida. Siempre que lleguemos a un número de diferentes
resultados, siempre queremos reducirlos a una expresión media o promedia, que
producirá el mismo resultado total. Verán ustedes, cuando lleguen al cálculo de
probabilidades, que toda esa ciencia prácticamente se basa en el principio que estamos
discutiendo.
El registro de nacimientos y muertes ha hecho posible la construcción de las
llamadas tablas de mortalidad, que demuestran qué proporción de un número dado de
niños nacidos al mismo tiempo o en el mismo año sobreviven al final de un año, dos
** Un bushel es una unidad de masa, utilizada principalmente en los países anglosajones, usada para medir la compra y venta de granos, harinas, etc.; en francés la palabra es boisseau, y no existe una traducción posible al español, ya que se emplea la misma palabra que en inglés, i. e., bushel. Nota del Traductor.
30
años, tres años, etc. Así que, sobre esta base, podemos preguntar cuál es el valor medio
o promedio de la vida de una persona en cualquier edad dada. Si vemos en las tablas el
número de personas viviendo en una edad determinada, y después añadimos a esto el
número de personas viviendo en todas las edades posteriores, es claro que esta suma nos
dará el número total de años que las personas que viven en la edad en cuestión todavía
vivirán. Consecuentemente, solamente es necesario dividir esta suma entre el número de
personas viviendo en una cierta edad, para obtener la duración promedio de vida de
tales personas, o, mejor aún, el número de años que cada persona debe vivir para que el
número total de años vivido por todos sea el mismo y que cada persona haya vivido un
número igual. A partir de esto, se ha encontrado que, al tomar la media de los resultados
de diferentes tablas de mortalidad, para un infante de un año la duración promedio de
vida es de aproximadamente 40 años; para un niño de diez años es también de 40 años;
para 20 es de 34; para 30 es de 26; para 40 es de 23; para 50 es de 17; para 60 es de 12;
para 70, 8; y para 80, 5.
Para tomar otro ejemplo, consideremos un número de diferentes experimentos
realizados. Tres experimentos han dado 4 como resultado; dos experimentos han dado
5; y uno ha dado 6. Para encontrar la media multiplicamos 4 por 3, 5 por 2, y 1 por 6,
añadimos (sumamos) los productos, lo que da 28, y dividimos 28 por el número de
experimentos, ó por 6, lo que da 3
24 como resultado medio de todos los experimentos.
Pero es evidente que este resultado puede ser considerado como exacto
solamente bajo la condición de haber supuesto que los experimentos fueron hechos con
igual precisión. Pero es imposible que tal cosa haya sido el caso, y es por lo tanto
imperativo tomar en cuenta estas desigualdades, un requerimiento que demandaría un
cálculo mucho más complicado que el que hemos empleado, y que ahora atrae la
atención de los matemáticos.
Lo precedente es la sustancia de la primera parte de la regla de aligación; la
segunda parte es lo opuesto de la primera. Dado el valor medio, encontrar cuánto debe
ser tomado de cada ingrediente para producir el valor medio requerido.
Los problemas de la primera clase están siempre determinados, porque, como
hemos visto, el número de unidades de cada ingrediente simplemente tiene que ser
multiplicado por el valor de cada ingrediente, y la suma de todos estos productos ser
dividida por el número de los ingredientes. Los problemas de la segunda clase, por otra
31
parte, están siempre indeterminados. Pero la condición de que solamente son admitidos
en el resultado números enteros positivos, sirve de límite al número de soluciones.
Supongamos que tenemos dos tipos de cosas, que el valor de la unidad de un
tipo es a, y que el de la segunda es b, y que queremos encontrar cuántas unidades del
primer tipo y cuántas unidades del segundo son necesarias para formar una mezcla o un
todo del cual el valor medio sea m. Llamemos x al número de unidades del primer tipo
que deben entrar en la mezcla, e y al número de unidades del segundo tipo. Es claro que
ax será el valor de las x unidades del primer tipo, y by el valor de las y unidades del
segundo. Por lo tanto, ax + by será el valor total de la mezcla. Pero, siendo por
suposición m el valor medio de la mezcla, la suma x + y de las unidades de la mezcla
multiplicada por m - el valor medio de cada unidad - debe producir el mismo valor total.
Tendremos, por consiguiente, la ecuación
.mymxbyax +=+
Transponiendo a un lado los términos multiplicados por x y al otro lado los términos
multiplicados por y, obtenemos:
.)()( ybmxma −=−
y dividiendo entre ma − obtenemos
,)(
ma
ybmx
−−=
donde parecería que el número y puede ser tomado a placer, porque cualquiera sea el
valor dado a y, habrá siempre un valor correspondiente de x que satisfará el problema.
Tal es la solución general que el álgebra ofrece. Pero si la condición es que los
dos números, x e y, sean enteros, entonces y no puede ser tomado a placer. Para ver
cómo podemos satisfacer esta última condición de la manera más simple, dividamos la
última ecuación por y, y tendremos
.ma
bm
y
x
−−=
Para que x e y sean ambas positivas, es necesario que las cantidades bm− y ma −
tengan ambas el mismo signo; es decir, si a es mayor o menor que m, entonces,
inversamente, b debe ser menor o mayor que m; o, en otras palabras, m debe estar entre
a y b, lo que es evidente dada la condición del problema. Supongamos, entonces, que a
es el mayor y b el menor de los dos precios. Queda por encontrar el valor de la fracción
,ma
bm
−−
32
que, si es necesario, puede ser reducida a sus términos más bajos. Dejemos que B
A sea
esa fracción reducida a sus términos más bajos. Es evidente que la solución más simple
será aquella en donde x = A e y = B. Pero como una fracción no se altera al multiplicar
su numerador y multiplicador por el mismo número, es claro que podemos también
tomar x = nB e y = nA, n siendo cualquier número entero, porque supusimos que x e y
son enteros. Y es fácil probar que estas expresiones de x e y son las únicas que
resolverán el problema propuesto. De acuerdo con la regla ordinaria de mezclas, x, la
cantidad del ingrediente más caro, es hecha igual a bm− , el exceso del precio
promedio por encima del precio más bajo, e y, la cantidad del ingrediente más barato,,
es hecha igual a ma − , el exceso del precio más alto por encima del precio promedio;
una regla que está contenida directamente en la solución general dada arriba.
Supongamos, ahora, que en lugar de dos tipos de cosas, tenemos tres tipos, los
valores de los cuales, empezando con los más altos, son a, b, y c. Dejemos que x, y, z
sean las cantidades que deben ser tomadas de cada una para formar una mezcla o
compuesto que tenga el valor medio m. La suma de los valores de las tres cantidades x,
y, z, será entonces .czbyax ++ Pero este valor total debe ser el mismo que el producido
si todos los valores individuales fuesen m, en cuyo caso el valor total es obviamente
.mzmymx ++ La siguiente ecuación, por lo tanto, debe ser satisfecha:
,mzmymxczbyax ++=++
o, de manera más simple,
.0)()()( =−+−+− zmcymbxma
Como hay tres cantidades desconocidas en esta ecuación, dos de ellas pueden ser
tomadas a placer. Pero si la condición es que deben ser expresadas por enteros
positivos, debe observarse, primero, que los números ma − y cm− son
necesariamente positivos; de manera que al poner la ecuación en la forma
,)()()( ybmzcmxma −=−−−
la cuestión se resuelve por sí misma al encontrar dos múltiplos de los números dados
ma − y cm− , cuya diferencia debe ser igual a .)( ybm−
Esta cuestión es siempre resoluble en números enteros, cualesquiera sean los
números dados de los que buscamos los múltiplos, y cualquiera sea la diferencia entre
estos múltiplos. Debido a que es lo suficientemente notable por sí misma, y que puede
33
ser de utilidad en muchas emergencias, daremos una solución general de ella, derivada
de las propiedades de las fracciones continuas.
Sean M y N dos números enteros. De estos dos números, se buscan dos múltiplos
xM, zN, cuya diferencia está dada y es igual a D. Entonces, tiene que ser satisfecha la
siguiente ecuación
,DzNxM =−
donde x, y x son, por suposición, números enteros. En primer lugar, resulta obvio que si
M y N no son primos entre sí, el número D es divisible por el máximo común divisor de
M y N; y, habiendo sido hecha la división, debemos tener una ecuación similar en donde
los números M y N sean primos entre sí, de manera que estamos siempre en libertad de
suponerlos reducidos a esa condición. Observo ahora que si sabemos la solución de la
ecuación para el caso en donde el número D es igual a +1 ó 1− , podemos deducir la
solución a partir de esto para cualquier valor de D. Por ejemplo, supongamos que
conocemos dos múltiplos de M y N, digamos pM y qN, cuya diferencia, qNpM − es
igual a .1± Entonces simplemente tenemos que multiplicar estos (ambos) múltiplos por
el número D para obtener una diferencia igual a D± . Y esto es porque, multiplicando la
ecuación precedente por D, tenemos
;DqDNpDM ±=−
y, sustrayendo la última ecuación de la ecuación original
,DzNxM =−
o añadiéndola, de acuerdo con si el término D tiene el signo −+ o ante él, obtenemos
,0)()( =− NqDzMpDx mm
que produce en seguida, como vimos arriba en la regla para la mezcla de dos
ingredientes diferentes,
,, nMqDznNpDx == mm
n siendo cualquier número. De manera general, tenemos
pDnNx ±= y qDnMz ±=
donde n es cualquier número entero, positivo o negativo. Queda solamente encontrar
dos números p y q tales que
.1±=− qNpM
Esta cuestión es fácilmente resoluble con la ayuda de las fracciones continuas. Porque
hemos visto, al tratar con estas fracciones, que si la fracción N
M es reducida a una
34
fracción continua, y se calculan todas las fracciones sucesivas que se aproximan a su
valor, la última de estas fracciones sucesivas siendo la fracción N
M en sí misma,
entonces la serie de las fracciones así alcanzadas es tal que la diferencia entre
cualesquiera dos fracciones consecutivas es siempre igual a la fracción de la cual el
numerador es unidad y el denominador el producto de los dos denominadores. Por
ejemplo, al designar por L
K a la fracción que inmediatamente precede a la última
fracción N
M, obtenemos necesariamente
1=− KNLM ó 1− ,
de acuerdo con esto, a si N
M es mayor o menor que
L
K; en otras palabras, de acuerdo a
si el lugar ocupado por la última fracción N
M en la serie de fracciones sucesivas
aproximándose a su valor es par o impar; porque, la primera fracción de la serie que se
aproxima es siempre más pequeño, el segundo más grande, el tercero más pequeño, etc.,
que la fracción original, que es idéntica a la última fracción de la serie. Haciendo, por lo
tanto, que p = L y q = K, el problema de los dos múltiplos se resuelve en toda su
extensión.
Es evidente ahora que, para aplicar la solución precedente a la cuestión inicial
relativa a la aligación, simplemente tenemos que poner
,, cmNmaM −=−= y ;)( ybmD −=
de tal manera que el número y sigue siendo indeterminado y puede ser tomado a placer,
como también puede serlo el número N, que aparece en la expresión por x y z.
35
LECCIÓN III
SOBRE ÁLGEBRA, Y PARTICULARMENTE SOBRE LA
RESOLUCIÓN DE ECUACIONES DE TERCER Y CUARTO GRADO
El álgebra es una ciencia que le debemos casi enteramente a los modernos. Digo
casi enteramente, porque tenemos un tratado escrito por los griegos, particularmente por
DIOFANTO, quien vivió en el siglo tercero de la era cristiana. Este trabajo es el único
que le debemos a los antiguos sobre esta rama de las matemáticas. Y cuando hablo de
los antiguos, me refiero solamente a los griegos, porque los romanos no dejaron
aportación alguna a las ciencias, y, al parecer, tampoco hicieron nada con respecto a
ellas.
DIOFANTO puede ser considerado como el inventor del álgebra. A partir de
unas palabras escritas en su prefacio, o mejor dicho en su carta de dedicación (porque
los geómetras antiguos solían dirigir sus producciones a ciertos amigos suyos, una
práctica ejemplificada en los prefacios de APOLONIO y ARQUÍMEDES); de unas
palabras en su prefacio, decía, sabemos que fue el primero en ocuparse de la rama de la
aritmética que desde entonces ha sido llamada álgebra.
Su trabajo contiene los primeros elementos de esta ciencia. Empleó, para
expresar la cantidad desconocida, una letra griega que corresponde a nuestro er††, y que
ha sido reemplazada, en las traducciones, por N. Para expresar las cantidades conocidas,
empleó únicamente números, porque el álgebra estaba destinada a estar restringida a la
solución de problemas numéricos. Encontramos, sin embargo, que al establecer sus
ecuaciones consonantemente con las condiciones del problema, utiliza las cantidades
conocidas y las desconocidas de igual forma. Y en esto consiste virtualmente la esencia
del álgebra, en emplear cantidades desconocidas, para calcular con ellas como lo
hacemos con las cantidades conocidas, y formar de ellas una o varias ecuaciones desde
las cuales el valor de las cantidades desconocidas pueda ser determinado. Aunque el
trabajo de DIOFANTO contiene casi exclusivamente problemas indeterminados, la
solución de los cuales la busca en los números racionales - problemas que han sido
designados, después de él, como problemas diofánticos -, encontramos en su trabajo, sin
†† Con er, me refiero a la abreviación de algunos números ordinales, tales como primer, tercer, etc. Nota del Traductor.
36
embargo, la solución a un número de problemas determinados del primer grado, e
incluso algunos que involucran varias cantidades desconocidas. En el último caso, sin
embargo, el autor invariablemente recurre a artificios particulares para reducir el
problema a una única cantidad desconocida, lo que no es difícil. Da también la solución
a ecuaciones de segundo grado, pero es cuidadoso para arreglarlas de tal manera que
nunca asuman la afectada forma que contiene al cuadrado y a la primera potencia de la
cantidad desconocida.
Propuso, por ejemplo, la siguiente cuestión, que involucra la teoría general de
ecuaciones del segundo grado.
Encontrar dos números, de los cuales la suma y el producto sean dados.
Si llamamos a la suma a y al producto b, tenemos inmediatamente, por la teoría de las
ecuaciones, la ecuación
.02 =+− baxx
DIOFANTO resuelve este problema de la siguiente manera. Siendo dada la suma de los
dos números, busca su diferencia, y toma a esto último como la cantidad desconocida.
Después expresa los dos números en términos de su suma y diferencia - uno por la
mitad de la suma más la mitad de la diferencia, el otro por la mitad de la suma menos la
mitad de la diferencia -, y luego simplemente tiene que satisfacer la otra condición al
igualar su producto con el número dado. Si llamamos a la suma dada a, y a la diferencia
desconocida x, uno de los números será 2
xa +, y el otro será .
2
xa − Multiplicando a
estos conjuntamente tenemos .4
22 xa − El término que contiene a x es eliminado, e,
igualando la última cantidad obtenida con el producto dado, tenemos la ecuación simple
,4
22
bxa =−
de lo cual obtenemos
,422 bax −=
y de esto último
.42 bax −=
DIOFANTO resuelve varios otros problemas de esta clase. Al tratar
adecuadamente a la suma o a la diferencia como la cantidad desconocida, siempre llega
37
a una ecuación en la que simplemente tiene que extraer una raíz cuadrada para
solucionar el problema.
Pero en los libros que han llegado a nosotros (porque el trabajo completo de
DIOFANTO no ha sido preservado), este autor no procede más allá de las ecuaciones de
segundo grado, y no sabemos si él o alguno de sus sucesores (porque ningún otro
trabajo sobre esta materia ha sido transmitido desde la antigüedad) llevó sus
investigaciones más allá de este punto.
Todavía tengo que comentar, en conexión con el trabajo de DIOFANTO, que él
enunció el principio de que, en la multiplicación, + y −− da , y que −− y da + , en
forma de definición. Pero soy de la opinión de que esto es un error de los copistas,
porque él debió de haber considerado esto como un axioma, tal como EUCLIDES lo
hizo para algunos principios de la geometría. Haya sido como haya sido, se verá que
DIOFANTO consideró la regla de los signos como un principio evidente por sí mismo,
y que no necesitaba de demostración alguna.
El trabajo de DIOFANTO tiene un valor incalculable, porque contiene los
primeros gérmenes de una ciencia que, debido al enorme progreso que desde entonces
ha tenido, constituye una de las mayores glorias del intelecto humano. DIOFANTO no
fue conocido en Europa sino hasta finales del siglo dieciséis, cuando, en 1575, Xylander
hizo una miserable traducción de su obra, basado en un manuscrito encontrado a
mediados del siglo dieciséis en la biblioteca del Vaticano, y que probablemente fue
llevado desde Grecia cuando los turcos tomaron posesión de Constantinopla.
Bachet de Méziriac, uno de los primeros miembros de la Academia Francesa, y
un matemático tolerablemente bueno para su época, publicó, en 1621, una nueva
traducción del trabajo de DIOFANTO, acompañada por largos comentarios, hoy
superfluos. La traducción de Bachet fue después reimpresa, con observaciones y notas,
por FERMAT, uno de los matemáticos más célebres de Francia, quien vivió a mediados
del siglo diecisiete, y del que tendremos ocasión de hablar más adelante, debido a los
importantes descubrimientos que hizo en el análisis. La edición de FERMAT es del año
1670. Es muy deseable que se hagan buenas traducciones, no solamente del trabajo de
DIOFANTO, sino también del pequeño número de trabajos matemáticos que los griegos
nos heredaron.
Sin embargo, anteriormente al descubrimiento y publicación de los trabajos de
DIOFANTO, el álgebra ya era conocida en Europa. A finales del siglo quince, apareció
en Venecia un trabajo sobre aritmética y geometría, realizado por un monje franciscano
38
italiano llamado Luca Pacioli, en el que se establecían las reglas elementales del
álgebra. Este libro fue publicado en 1494, cuando apenas se había inventado la
imprenta, y el hecho de que el nombre álgebra fuese dado a esta nueva ciencia,
demuestra claramente que proviene de los árabes. Es verdad que el significado de esta
palabra árabe es discutido, pero no nos entretendremos con estas cuestiones, porque son
ajenas a nuestro propósito. Sea suficiente con decir que la palabra se ha convertido en el
nombre de una ciencia que es universalmente conocida, y que no existe ningún tipo de
ambigüedad referente a su significado, ya que, hasta el tiempo presente, nunca ha sido
empleada para designar algo más.
No sabemos si el álgebra fue inventada por los árabes, o si éstos la tomaron de
los griegos. Existen razones para creer que estaban en posesión del trabajo de
DIOFANTO, porque cuando las épocas de barbarismo e ignorancia que siguieron a sus
primeras conquistas habían pasado, empezaron a dedicarse a las ciencias y a traducir al
árabe todos los trabajos griegos que trataran sobre temas científicos. Es razonable
suponer, por lo tanto, que también tradujeron el trabajo de DIOFANTO, y que este
mismo trabajo los estimuló para llevar más lejos sus investigaciones sobre esta ciencia.
Sea como fuere, los europeos, habiendo recibido el álgebra de los árabes,
estaban en posesión de ella cientos de años antes de que el trabajo de DIOFANTO fuese
conocido por ellos. Sin embargo, no hicieron un progreso más allá de ecuaciones de
primer y segundo grado. En el trabajo de Pacioli, que mencionamos arriba, la resolución
general de ecuaciones de segundo grado, tal como la tenemos ahora, no estaba dada. En
este trabajo, encontramos simples reglas, expresadas en deficientes versos latinos, para
resolver cada caso particular de acuerdo con las diferentes combinaciones de los signos
de los términos de la ecuación, e inclusive estas reglas solamente aplicaban a los casos
en donde las raíces fuesen reales y positivas. A las raíces negativas, todavía se las
consideraba como superfluas y sinsentido. Realmente, fue la geometría la que nos
sugirió el uso de cantidades negativas, y en esto consiste uno de los mayores avances
que han resultado de la aplicación del álgebra a la geometría, un paso que debemos a
DESCARTES.
En el periodo posterior, se investigó la resolución de ecuaciones de tercer grado,
y el descubrimiento para un caso particular fue hecho por un matemático de Bolonia,
llamado Scipio Ferreus (1515). Dos otros matemáticos italianos, Tartaglia y Cardano,
perfeccionaron la solución dada por Ferreus y la hicieron general para todas las
ecuaciones de tercer grado. En este periodo, Italia, que era la cuna del álgebra en
39
Europa, era prácticamente la única cultivadora de la ciencia, y no fue hasta mediados
del siglo dieciséis cuando otros tratados sobre álgebra empezaron a aparecer en Francia,
Alemania, y en otros países. Los trabajos de Pelletier y de Buteo fueron los primeros
que Francia produjo sobre esta ciencia; el tratado del primero fue impreso en 1554, y el
del segundo en 1559.
Tartaglia expuso su solución en un trabajo (1546) - y en deficientes versos
italianos - que trataba diversas cuestiones e invenciones, y que tiene la distinción de ser
uno de los primeros en tratar el moderno tema de las fortificaciones de bastiones.
Aproximadamente al mismo tiempo (1545), Cardano publicó su tratado Ars
Magna, o Algebra, y en el que dejó casi nada sobre la resolución de ecuaciones de tercer
grado. Cardano fue el primero en percibir que las ecuaciones tienen varias raíces, y en
distinguirlas en positivas y negativas. Pero es particularmente conocido por haber sido
el primero en hacer observaciones sobre el llamado caso irreductible, en el cual la
expresión de las raíces reales aparece en una forma imaginaria. Cardano estaba
convencido, sobre ciertos casos especiales en donde la ecuación tenía divisores reales,
que la forma imaginaria no evitaba que las raíces tuvieran un valor real. Pero aún estaba
por probarse no sólo que las raíces eran reales en el caso irreductible, sino que era
imposible que las tres - conjuntamente - fueran reales, excepto en ese caso. Esta prueba
fue suministrada más tarde por Vieta, y particularmente por Albert Girard, a partir de
consideraciones relacionadas con la trisección de un ángulo.
Volveremos más tarde al caso irreductible de las ecuaciones de tercer grado, no
solamente porque presenta una nueva forma de expresión algebraica que ha encontrado
una aplicación extensa en el análisis, sino porque constantemente está dando lugar a
investigaciones improductivas, que intentan reducir la forma imaginaria a una forma
real, y porque, debido a esto, se presenta en el álgebra un problema que puede ser
puesto a la altura de los problemas concernientes a la duplicación del cubo y al
cuadrado del círculo, en geometría.
Los matemáticos del periodo que estamos hablando, acostumbraban proponerse
trabajos entre ellos para ser solucionados. Estos problemas representaban desafíos
públicos, y servían para estimular y mantener en la mente de los pensadores la
fermentación necesaria para la búsqueda científica. Los desafíos continuaron siendo
comunes entre los matemáticos europeos hasta principios del siglo dieciocho, y no
cesaron sino hasta el surgimiento de las academias, que cumplieron el mismo fin pero
de una manera mucho más conducente para el progreso de la ciencia, en parte debido a
40
la unión de conocimiento de sus distintos miembros, en parte debido a las relaciones
que mantenían entre ellos, y en parte también debido a la publicación de sus memorias,
que servían para diseminar los nuevos descubrimientos y observaciones entre todas las
personas interesadas en la ciencia.
Los desafíos de los que estamos hablando, suplieron, en buena medida, la falta
de academias, que aún no existían, y les debemos muchos descubrimientos importantes
en análisis. Uno de ellos fue la resolución de ecuaciones de cuarto grado, que fue
propuesta en el siguiente problema.
Encontrar tres números en proporción continua, de los cuales la suma es 10, y
el producto de los dos primeros 6.
Generalizando y llamando a la suma de los tres números a, al producto de los
primeros dos b, y a los primeros dos números x, y, debemos tener, primero, xy = b.
Debido a la proporción continua, el tercer número será expresado por ,2
x
y de tal forma
que la condición restante será
.2
ax
yyx =++
De la primera ecuación, obtenemos ,y
bx = que, sustituida en la segunda, da
.3
ab
yy
y
b =++
Removiendo las fracciones y arreglando (acomodando) los términos, finalmente
tenemos
,0224 =+−+ babybyy
una ecuación de cuarto grado en donde falta el segundo término.
De acuerdo con Bombelli, de quien hablaremos más después, Luigi Ferrari de
Bolonia, resolvió el problema a partir de un método sumamente ingenioso, y que
consiste en dividir la ecuación en dos partes que (ambas) permiten la extracción de la
raíz cuadrada. Para hacer esto, es necesario añadir a los dos números cantidades cuya
determinación dependa de una ecuación del tercer grado, de manera que la resolución de
ecuaciones de cuarto grado, depende de la resolución de ecuaciones de tercer grado, y
esto está sujeto, por lo tanto, a los mismos inconvenientes que el caso irreductible.
El Algebra de Bombelli fue impresa en Bolonia en 1579 en italiano. Contiene no
sólo el descubrimiento de Ferrari, sino también otras observaciones importantes sobre
41
ecuaciones de segundo y tercer grado, y particularmente sobre la teoría de los radicales
por medio de los cuales, el autor, tuvo éxito para extraer las raíces cúbicas imaginarias
de los dos binomios de la fórmula del tercer grado en el caso irreductible, encontrando
así un resultado perfectamente real, y proporcionando, a su vez, la prueba más
posiblemente directa sobre la realidad de este tipo de expresiones.
Tal es la sucinta historia del primer progreso del álgebra en Italia. La solución de
ecuaciones de tercer y cuarto grado se consiguió rápidamente. Pero, por más de dos
siglos, los esfuerzos de los matemáticos han resultado infructíferos para superar las
dificultades que implica la ecuación de quinto grado.
Aún así, estos esfuerzos están lejos de ser en vano. Han dado lugar a muchos
preciosos teoremas que poseemos para la formación de ecuaciones, al carácter y signos
de las raíces, a la transformación de una ecuación dada en otras, en las cuales las raíces
pueden ser formadas a placer desde las raíces de la ecuación dada, y, finalmente, a las
bellas consideraciones concernientes a la metafísica de la resolución de ecuaciones, de
las cuales ha resultado, cuando ha sido posible, el método más directo para llegar a su
solución. Todo esto ha sido presentado a ustedes en lecciones previas, y es deseable que
fuese aplicable a la resolución de ecuaciones de más alto grado.
Vieta y Descartes en Francia, Harriot en Inglaterra, y Hudde en Holanda, fueron
los primeros, después de los italianos que acabamos de mencionar, en perfeccionar la
teoría de las ecuaciones, y debido a que desde su tiempo apenas existen matemáticos de
nota que no se hayan dedicado a estas investigaciones, de manera que en el estado
presente esta teoría es el resultado de muchas investigaciones diferentes, es
extremadamente difícil asignar un autor a cada uno de los numerosos descubrimientos
que la constituyen.
Había prometido volver al caso irreductible. Para este fin, será necesario
recordar el método que parece haber llevado a la resolución original de las ecuaciones
de tercer grado, y que todavía es utilizado en la mayoría de los tratados sobre álgebra.
Consideremos la ecuación general de tercer grado, privada de su segundo término, que
siempre puede ser removido; en una palabra, consideremos la ecuación
.03 =++ qpxx
Supongamos que
,zyx +=
42
donde y y z son dos nuevas cantidades desconocidas, de las cuales una puede ser tomada
a placer y determinada como pensemos más conveniente. Sustituyendo este valor por x,
obtenemos la ecuación transformada
.0)(33 3223 =++++++ qzypzyzzyy
Factorizando los dos términos 22 33 yzzy + obtenemos
),(3 zyyz +
y la ecuación transformada puede ser escrita como sigue:
.0))(3(33 =+++++ qzypyzzy
Poniendo el factor que multiplica a zy + igual a cero - lo que es permisible debido a las
dos cantidades indeterminadas involucradas -, debemos tener las ecuaciones
03 =+ pyz
y
,033 =++ qzy
a partir de lo cual y y z pueden ser determinadas. El medio que más naturalmente surge
para este fin es tomar de la primera ecuación el valor de z,
,3y
pz −=
y sustituirlo en la segunda ecuación, eliminando las fracciones por multiplicación.
Procediendo así, obtenemos la siguiente ecuación de sexto grado en y, llamada la
ecuación reducida,
,027
336 =−+ p
qyy
y que, debido a que contiene solamente dos potencias de la cantidad desconocida, una
de las cuales es el cuadrado de la otra, se resuelve a la manera de ecuaciones de segundo
grado, y da
,2742
323 pqq
y ++−=
de la cual, al extraer la raíz cúbica, tenemos
3
32
,2742
pqqy ++−=
y, finalmente,
43
.3y
pyzyx −=+=
Esta expresión para x puede ser simplificada al observar que el producto de y por el
radical
3
32
2742
pqq +−−
suponiendo multiplicadas conjuntamente a todas las cantidades bajo el signo, es
3
3
.327
pp −=−
El término y
p
3, de acuerdo con esto, toma la forma
3
32
,2742
pqq +−−−
y tenemos que
3
32
2742
pqqx ++−= + 3
32
,2742
pqq +−−
una expresión en donde la raíz cuadrada que está por debajo del radical cúbico aparece
en formas de más y menos, y, consecuentemente, no hay lugar para la ambigüedad a
este respecto.
Esta última expresión es conocida como la regla de Cardano, y hasta ahora no
ha habido algún método ideado para la resolución de ecuaciones de tercer grado que no
conduzca a él. Debido a que los radicales cúbicos presentan naturalmente un único
valor, durante mucho tiempo se pensó que la regla de Cardano podía solamente dar una
de las raíces de la ecuación, y que para encontrar las otras dos, debíamos recurrir a la
ecuación original y dividirla por ax− , a siendo la primera raíz encontrada. El cociente
resultante, siendo una ecuación de segundo grado, podía ser resuelto en la manera usual.
La división en cuestión no es solamente siempre posible, sino que también es muy fácil
de realizar. Porque, en el caso que estamos considerando, siendo la ecuación
,03 =++ qpxx
si a es una de las raíces, tenemos
,03 =++ qpaa
y que, sustraída de lo precedente, dará
44
,0)(33 =−+− axpax
una cantidad divisible por ax− , y que tiene como su cociente resultante
;022 =+++ paaxx
de manera que la nueva ecuación a ser resuelta con el fin de encontrar las otras dos
raíces, será
,022 =+++ paaxx
de la cual tenemos, en seguida
.4
3
2
2ap
ax −−±−=
Veo por el Algebra de Clairaut, impresa en 1746, y por el artículo de
D’Alembert sobre el Caso Irreductible en la primera Enciclopaedia, que la idea a la que
nos referimos prevalecía incluso en ese periodo. Pero constituiría una gran injusticia
para el álgebra el acusarla de no producir resultados que posean toda la generalidad de
la que es susceptible la cuestión. El único requisito es ser capaces de leer la escritura
del álgebra, y entonces podremos ver en ella todo lo que por su naturaleza puede hacer
para contener. En el caso que estamos considerando, olvidamos que cada raíz cúbica
puede tener tres valores, así como cada raíz cuadrada tiene dos. Porque la extracción de
la raíz cúbica de a, por ejemplo, es meramente equivalente a la resolución de la
ecuación del tercer grado .03 =− ax Haciendo que 3 ,ayx = esta última ecuación se
convierte en la forma más simple 013 =−y , teniendo como raíz .1=y Después,
dividiendo por ,1−y tenemos
,012 =++ yy
a partir de lo cual deducimos directamente las otras dos raíces
.2
31 −±−=y
De acuerdo con esto, estas tres raíces son las tres raíces cúbicas de unidad, y pueden ser
hechas para dar las tres raíces cúbicas de cualquier otra cantidad a al multiplicarlas por
la raíz cúbica ordinaria de esa cantidad. Es lo mismo con las raíces de cuarto, quinto, y
todos los grados siguientes. Por razones de brevedad, designemos las dos raíces
2
31 −+− y ,
2
31 −−−
45
como m y n. Se verá que son imaginarias, aunque su cubo sea real e igual a 1, y
podemos convencernos fácilmente de esto si las elevamos a la tercera potencia.
Tenemos, por lo tanto, para las tres raíces cúbicas de a,
3 ,a 3 ,am 3 .an
Ahora bien, en la resolución de la ecuación de tercer grado que consideramos
arriba, al llegar a la expresión reducida ,3 Ay = donde por brevedad supusimos
,2742
32 pqqA ++−=
deducimos solamente el siguiente resultado:
3 .Ay =
Pero por lo que acabamos de ver, es claro que no tendríamos que tener solamente
3 ,Ay =
sino también
3 Amy = ; 3 .Any =
La raíz x de la ecuación de tercer grado que encontramos igual a
,3y
py −
tendrá, debido a esto, los siguientes tres valores
3 A ,33 A
p− 3 Am ,3 3 Am
p− 3 An ,3 3 An
p−
y que serán las tres raíces de la ecuación propuesta. Pero al hacer que
,2742
32 pqqB +−−=
es claro que
,27
3pAB −=
donde
3 A 3 B× .3
p−=
Sustituyendo 3 B por 33 A
p− , y señalando que 1=mn , y que consecuentemente
,1
,1
mn
nm
==
46
las tres raíces que estamos considerando serán expresadas como sigue:
3 Ax = 3 B+ , x= 3 Am 3 Bn+ ,
3 Anx = .3 Bm+
Podemos ver, de acuerdo con esto, que cuando es propiamente entendido, el
método ordinario da directamente las tres raíces, y solamente da tres. He creído
necesario entrar en estos pequeños detalles por la razón de que, por un lado, al método
se le ha acusado de ser solamente capaz de dar una sola raíz, y por el otro lado, cuando
se ha visto que realmente da tres, se ha pensado que debió haber dado seis, debido al
falso empleo de todas las combinaciones posibles de las tres raíces cúbicas de unidad, a
saber, 1, m, n, con los dos radicales cúbicos 3 A y .3 B
Pudimos haber llegado directamente a los resultados que acabamos de encontrar
al observar que las dos ecuaciones
033 =++ qzy y 03 =+ pyz
dan
qzy −=+ 33 y ;27
333 p
zy −=
donde en seguida se verá que 3y y 3z son las raíces de una ecuación de segundo grado
de la cual el segundo término es q y el tercero .27
3p− Esta ecuación, que es llamada la
ecuación reducida, tendrá entonces la forma
;027
32 =−+ p
quu
y si llamamos a sus dos raíces A y B, inmediatamente tendremos
3 ,Ay = 3 Bz = ,
donde se observará que A y B tienen los mismos valores que los que tenían en la
discusión previa. Ahora, a partir de lo que ha pasado antes, igualmente tendremos
3 Amy = ó 3 ,Any =
y lo mismo será válido para z. Pero la ecuación
3
pzy −= ,
de la cual solamente hemos empleado el cubo, limita estos valores, y es fácil ver que la
restricción requiere que los tres valores correspondientes de z sean
47
3 ,B 3 ,Bn 3 Bm ;
de donde se sigue que, para el valor de x, que es igual a zy + , son los mismos tres
valores que encontramos arriba.
En cuanto a la forma de estos valores, es evidente, primero, que mientras que A
y B sean cantidades reales, solamente uno de ellos puede ser real, porque m y n son
imaginarias. Consecuentemente, solamente pueden ser los tres reales en el caso en
donde las raíces A y B - de la ecuación reducida - sean imaginarias, esto es, cuando la
cantidad
274
32 pq +
por debajo del signo radical sea negativa, lo que sucede solamente si p es negativa y
mayor que
3
2
.4
3q
Y este es el llamado caso irreducible.
Ya que aquí
274
32 pq +
es una cantidad negativa, supongámosla igual a 2g− , g siendo cualquier cantidad real.
Entonces haciendo que, en aras de la simplicidad,
,2
fq =−
las dos raíces A y B - de la ecuación reducida - asumen la forma
,1−+= gfA .1−−= gfB
Ahora yo digo que si 3 A + 3 B , que es una de las raíces de la ecuación de
tercer grado, es real, entonces las otras dos raíces, expresadas por
3 Am + 3 Bn y 3 An + 3 Bm ,
también serán reales. Pongamos que
3 A ,t= 3 B ;u=
tendremos
,hut =+
donde h, por hipótesis, es una cantidad real. Ahora,
48
3 ABtu = y ,22 gfAB +=
por lo tanto
3 22 ;gftu +=
y, elevando la ecuación hut =+ al cuadrado, tenemos
;2 222 hutut =++
de la cual, sustrayendo 4tu, obtenemos
3 2222 .4)( gfhut +−=−
Observo que esta cantidad necesariamente tiene que ser negativa, porque si fuese
positiva e igual a 2k , tendríamos
,)( 22 kut =−
donde
kut =− ,
Entonces como
,hut =+
se sigue que
2
kht
+= y ,2
khu
−=
siendo ambas cantidades reales. Pero entonces 3t y 3u serían también cantidades reales,
lo que es contrario a nuestra hipótesis, dado que estas cantidades son iguales a A y B,
ambas siendo imaginarias.
La cantidad
3 222 4 gfh +−
por consiguiente, es necesariamente negativa. Supongamos que es igual a ;2k−
tendremos entonces que
,)( 22 kut −=−
y, extrayendo la raíz cuadrada,
;1−=− kut
donde
3
2
1A
kht =−+= , 3 .
2
1B
khu =−−=
Tal será, necesariamente, la forma de los dos radicales cúbicos
49
3 1−+ gf y 3 ,1−− gf
una forma a la que podemos llegar directamente al expandir estas raíces en series de
acuerdo con el teorema newtoniano. Pero debido a que las pruebas por series suelen
dejar alguna duda en la mente, he buscado hacer que la discusión precedente esté libre
de ellas.
Si, por lo tanto,
3 A 3 ,hB =+
tenemos que
3 A2
1−+= kh y 3 B .
2
1−−= kh
Ahora bien, arriba hemos encontrado que
,2
31 −+−=m ;2
31 −−−=n
por eso, al multiplicar estas cantidades conjuntamente, tenemos que
3 Am 3 Bn+2
3kh+−=
y que
3 An 3 Bm+ ,2
3kh−−=
que son cantidades reales. Consecuentemente, si la raíz h es real, las otras dos raíces
también serán reales en el caso irreducible, y lo serán solamente en ese caso.
Pero la dificultad invariable es demostrar directamente que
,11 33 −−+−+ gfgf
que hemos supuesto igual a h, sea siempre una cantidad real, sean cuales sean los
valores de f y g. En algunos casos particulares, la demostración puede efectuarse por la
extracción de la raíz cúbica, cuando esto último es posible. Por ejemplo, si
,11,2 == gf encontraremos que la raíz cúbica de 1112 −+ será 12 −+ , y que,
similarmente, la raíz cúbica de 1112 −− será 12 −− , y que la suma de los radicales
será 4. Se puede construir un número infinito de ejemplos de esta clase, y fue a partir de
la consideración de tales casos, que Bombelli se convenció de la realidad de la
expresión imaginaria en la fórmula para el caso irreductible. Pero aún cuando la
extracción de raíces cúbicas es - en general - posible solamente por medio de las series,
50
no podemos llegar, por esta forma, a una demostración general y directa de la
proposición que estamos considerando.
Sucede de otra manera con las raíces cuadradas y con todas las raíces cuyos
exponentes sean potencias de 2. Por ejemplo, si tenemos la expresión
,11 −−+−+ gfgf
compuesta de dos radicales imaginarios, su cuadrado será
,22 22 gff ++
una cantidad necesariamente positiva. Extrayendo la raíz cuadrada, para obtener la
expresión equivalente, tenemos
,22 22 gff ++
para el valor real de la cantidad imaginaria con la que empezamos. Pero si en lugar de la
suma tuviéramos la diferencia entre los dos radicales imaginarios propuestos,
hubiéramos tenido, para su cuadrado, la siguiente expresión
,22 22 gff +−
una cantidad necesariamente negativa; y, tomando la raíz cuadrada de esta última,
habremos obtenido la simple expresión imaginaria
.22 22 gff +−
Además, si la cantidad
44 11 −−+−+ gfgf
nos fuese dada, tendríamos, al elevar al cuadrado, la forma
,222211 4 22224 22 gfgffgfgfgf ++++=++−−+−+
una cantidad real y positiva. Extrayendo la raíz cuadrada de esta expresión, debemos
obtener un valor real para la cantidad original; y así sucesivamente para todas las otras
raíces pares restantes. Pero si queremos aplicar el método precedente a radicales
cúbicos, llegaríamos de nuevo a ecuaciones de tercer grado en el caso irreductible.
Por ejemplo, sea
.11 33 xgfgf =−−+−+
Elevando al cubo, tenemos
( ) ;1132 3333 22 xgfgfgff =−−+−+++
esto es
51
,32 33 22 xgfxf =++
o, con los términos propiamente arreglados (acomodados),
,023 3 223 =−+− fgfxx
la fórmula general del caso irreductible, porque
( ) .327
1)2(
4
1 23
3 222 ggff −=+−+
Si 0=g , debemos tener que .23 fx = El único desiderátum‡‡ , por lo tanto, es
demostrar que si g tiene cualquier valor, x tiene un valor real correspondiente. Luego, la
segunda última ecuación§§ da
x
fxgf
3
233 22 −=+
y elevando al cubo obtenemos
,27
81263
3236922
x
ffxfxxgf
−+−=+
y en donde
,27
81563
323692
x
ffxfxxg
−−−=
una ecuación que puede ser escrita como sigue
( )( ),
27
83
2332
x
fxfxg
+−=
o, mejor, así
( ) .8
127
1 233
2 fxx
fg +
−=
Es evidente, a partir de la última expresión, que g es cero cuando fx 83 = ; y,
además, que g incrementa constante e ininterrumpidamente a medida que x incrementa;
porque el factor ( )23 fx + aumenta constantemente, y el otro factor 3
81
x
f− también
sigue aumentando, y podemos observar que, mientras el denominador 3x se incrementa,
la parte negativa 3
8
x
f, que es originalmente igual a 1, crece constantemente menos que
‡‡ Deseo, anhelo, que Lagrange demostrará a continuación. Nota del Traductor. §§ Lagrange se refiere a la ecuación ,32 33 22 xgfxf =++ que es la que utilizará para demostrar
este último punto. Nota del Traductor.
52
1. Por lo tanto, si el valor de 3x se incrementa por grados insensibles desde f8 al
infinito, el valor de 2g también aumentará por grados insensibles y correspondientes
desde cero al infinito. Y, por consiguiente, a cada valor de 2g desde cero al infinito
corresponde, recíprocamente, algún valor de 3x que yace entre los límites de f8 y el
infinito, y como esto es así sin importar cuál sea el valor de f , podemos legítimamente
concluir que, sean los valores de f y g los que sean, el valor correspondiente de 3x - y,
por lo tanto, también de x - será siempre real.
¿Pero cómo debe ser asignado este valor de x? Parecería que puede ser
representado solamente por una expresión imaginaria o por una serie que sea el
desarrollo de una expresión imaginaria. Vamos a considerar a esta clase de expresiones
imaginarias, que corresponde a los valores reales, como constituyente de una nueva
especie de expresiones algebraicas y, aunque éstas no sean, como otras expresiones,
susceptibles de ser numéricamente evaluadas en la forma en la que existen, poseen la
indiscutible ventaja - y este es el principal requisito - de que pueden ser empleadas en
las operaciones del álgebra exactamente como si no contuvieran expresiones
imaginarias. Además tienen la ventaja de ser sumamente útiles en las construcciones
geométricas, como veremos en la teoría de las secciones angulares, de forma tal que
siempre pueden ser exactamente representadas por líneas; en cuanto a su valor
numérico, siempre podemos encontrarlo de manera aproximada y en cualquier grado de
exactitud que queramos, ya sea por la resolución aproximada de la ecuación de la que
dependan, o por el uso de simples tablas trigonométricas.
En la geometría, está demostrado que si en un círculo que tenga un radio r, se
toma un arco cuya cuerda sea c, y que si la cuerda de la tercera parte de ese arco es x,
tendremos, para la determinación de x, la siguiente ecuación de tercer grado
,03 223 =+− crxrx
una ecuación que nos conduce al caso irreducible, porque c es siempre necesariamente
menor que 2r, y que, debido a las dos cantidades indeterminadas r y c, puede ser tomada
como el tipo de todas las ecuaciones de esta clase. Porque, si la comparamos con la
ecuación general
,03 =++ qpxx
tendremos
53
3
pr −= y
p
qc
3−=
de manera que, al hacer la trisección del arco correspondiente a la cuerda c en un círculo
del radio r, debemos obtener, en seguida, el valor de una raíz x, que será la cuerda de la
tercera parte de ese arco. Ahora bien, debido a la naturaleza de un círculo, la misma
cuerda c corresponde no solamente al arco s sino (llamando a la circunferencia entera u)
también a los arcos
,su − ,2 su + ,...3 su −
También los arcos
,su + ,2 su − ,...3 su +
tienen la misma cuerda, pero tomada negativamente, porque al completar una
circunferencia entera, las cuerdas se vuelven cero y después negativas, y no se vuelven
positivas otra vez hasta completar la segunda circunferencia, como ustedes pueden ver
fácilmente. Por consiguiente, los valores de x no son solamente la cuerda del arco ,3
s
sino también las cuerdas de los arcos
,3
su − ,
3
2 su +
y estas cuerdas serán las tres raíces de la ecuación propuesta. Si tomáramos los arcos
sucesivos que tienen la misma cuerda c, simplemente llegaríamos a las mismas raíces,
porque el arco su −3 daría la cuerda de ,3
3 su − esto es, de ,
3
su − que, como ya hemos
visto, es la misma que la de ,3
s y así con el resto.
Como en el caso irreductible el coeficiente p es necesariamente negativo, el
valor de la cuerda dada c será positivo o negativo dependiendo de si q es positiva o
negativa. En el primer caso, tomamos por s el arco subtendido por la cuerda positiva
.3
p
qc −= El segundo caso es reducible del primero al hacer a x negativa, por lo cual el
signo del último término es cambiado; de manera que, si tomamos de nuevo para s un
arco subtendido por la cuerda positiva ,3
p
q simplemente tenemos que cambiar el signo
de las tres raíces.
54
Aunque la discusión precedente pueda ser suficiente para disipar todas las dudas
concernientes a la naturaleza de las raíces de las ecuaciones de tercer grado, vamos a
añadir algunas reflexiones referentes al método por el cual las raíces son encontradas. El
método que hemos propuesto en lo precedente y que es conocido comúnmente como el
método de Cardano, aunque a mí me parece que se lo debemos a Hudde, ha sido
frecuentemente criticado, y sin duda seremos siempre criticados, porque damos a las
raíces, en el caso irreductible, una forma imaginaria, simplemente porque aquí se hace
una suposición que es contradictoria a la naturaleza de la ecuación. Porque la esencia
del método consiste en que supone la cantidad desconocida igual a dos cantidades
indeterminadas zy + , de manera que después podamos separar la ecuación resultante
( )( ) 0333 =+++++ qzypyzzy
en lo siguiente:
03 =+ pyz y .033 =++ qzy
Ahora, convirtiendo la primera de estas ecuaciones en la forma
27
333 p
zy −=
resulta evidente que la cuestión se reduce a encontrar dos números 3y y 3z cuya suma
sea q− , y cuyo producto sea ,27
3p− lo que es imposible, a menos que el cuadrado de la
mitad de la suma exceda al producto, porque la diferencia entre estas dos cantidades es
igual al cuadrado de la mitad de la diferencia de los números buscados.
La conclusión natural fue que no eran tan sorprendente el que llegáramos a
expresiones imaginarias al proceder desde una suposición imposible de expresar en
números, y, debido a esto, algunos escritores se han visto inducidos a creer que, al
adoptar un rumbo diferente, la expresión en cuestión lograría ser evitada, y que las
raíces podrían ser obtenidas en su forma real.
Debido a que más o menos se puede hacer la misma objeción a los otros
métodos que desde entonces han sido encontrados, y a que todos, de igual forma, se
basan en el método de los indeterminados, esto es, en la introducción de ciertas
cantidades arbitrarias a ser determinadas para satisfacer las condiciones del problema,
proponemos considerar la cuestión de la realidad de las raíces por sí mismas,
independientemente de cualquier suposición. Tomemos de nuevo la ecuación
;03 =++ qpxx
55
y supongamos que sus tres raíces son a, b, c.
Por la teoría de las ecuaciones, la parte izquierda de la expresión precedente es el
producto de tres cantidades
,ax − ,bx− ,cx−
que, multiplicadas conjuntamente, dan
;)()( 23 abcxbcacabxcbax −+++++−
y, comparando los términos correspondientes, tenemos
,0=++ cba ,pbcacab =++ .qabc −=
Como el grado de la ecuación es impar, podemos estar seguros, como sin duda ustedes
ya saben, y en cualquier caso veremos claramente esto en la lección que sigue, que
necesariamente tiene una raíz real. Sea esa raíz c. La primera de las tres ecuaciones que
recién encontramos será, entonces
,bac −−=
de donde resulta obvio que ba + es también necesariamente una cantidad real.
Sustituyendo el último valor de c en la segunda y tercera ecuaciones, tenemos que
,22 pbababaab =−−−− ,)( qbaab −=+−
ó
,22 pbaba −=++ ,)( qbaab =+
a partir de lo cual a y b tienen que ser encontradas. La última ecuación da ,ba
qab
+=
por lo cual concluyo queabes también necesariamente una cantidad real. Consideremos
ahora la cantidad ,274
32 pq + o, eliminando las fracciones, la cantidad ,427 32 pq + sobre
cuyo signo depende el caso irreducible. Sustituyendo en esto, por p y q, su valor como
dado arriba en términos de a y b, encontramos que, cuando han sido hechas las
reducciones necesarias, la cantidad en cuestión es igual al cuadrado de
2233 3322 abbaba −+−
tomada negativamente; de manera que, al cambiar los signos y extraer la raíz cuadrada,
tenemos
,4273322 322233 pqabbaba −−=−+−
de donde es fácil inferir que las dos raíces a y b no pueden ser reales a menos que la
cantidad 32 427 pq + sea negativa. Pero demostraré que, en tal caso, que es, como
56
sabemos, el caso irreductible, las dos raíces a y b son necesariamente reales. La
cantidad
2233 3322 abbaba −+−
puede ser reducida a la forma
),522)(( 22 abbaba ++−
como la multiplicación lo puede demostrar. Ahora bien, ya hemos visto que las dos
cantidades ba + y ab son necesariamente reales, de donde se sigue que
abbaabba ++=++ 222 )(2522
es también necesariamente real. Por lo tanto, el otro factor ba − es también real cuando
el radical 32 427 pq −− es real. Entonces, al ser ba + y ba − cantidades reales,
también lo son a y b.
Ya hemos derivado los teoremas precedentes de la forma de las raíces en sí
mismas. Pero la demostración presente es, en algunos aspectos, más general y más
directa, y es deducida de los principios fundamentales del problema en sí mismo. No
hemos hecho suposición alguna, y la naturaleza particular del caso irreductible carece
de cantidades imaginarias.
Pero los valores de a y b todavía tienen que ser encontrados a partir de las
ecuaciones precedentes. Y para este fin, observo que la parte izquierda de la ecuación
( ) 322233 4272
1
2
3pqabbaba −−=−+−
puede ser hecha un cubo perfecto al añadir la parte izquierda de la ecuación
,)( qbaab =+
multiplicada por ,2
33 − y que la raíz de este cubo es
ab2
31
2
31 −+−−−
de manera que, extrayendo la raíz cúbica de ambos lados, tendremos la expresión
ab2
31
2
31 −+−−−
expresada en cantidades conocidas. Y como el radical 3− puede también ser
considerado en su forma negativa, también tendremos la expresión
ab2
31
2
31 −−−−+
57
expresada en cantidades conocidas, y a partir de la cual los valores de a y b pueden ser
deducidos. Y estos valores contendrán la cantidad imaginaria 3− , que fue introducida
por multiplicación, y serán reducibles a la misma forma con las dos raíces
33 BnAm + y 33 BmAn +
que encontramos arriba. La tercera raíz
bac −−=
será entonces expresada por .33 BA +
Por este método, vemos que las cantidades imaginarias empleadas han
simplemente servido para facilitar la extracción de la raíz cúbica sin la cual nos hubiera
resultado imposible determinar por separado los valores de a y b. Y como
aparentemente es imposible alcanzar este objetivo por un método diferente, podemos
considerar al método que empleamos como una verdad demostrada de que la expresión
general de las raíces de una ecuación de tercer grado en el caso irreductible, no puede
hacerse independiente de cantidades imaginarias.
Pasemos ahora a las ecuaciones de cuarto grado. Ya hemos dicho que el
artificio empleado originalmente para resolver estas ecuaciones consistía en arreglarlas
(acomodarlas) de tal manera que la raíz cuadrada de los dos lados pudiera ser extraída, y
por lo cual eran reducidas a ecuaciones de segundo grado. Lo que sigue es un ejemplo
del procedimiento empleado. Sea
024 =+++ rqxpxx
la ecuación general de cuarto grado privada de su segundo término, que siempre puede
ser eliminado, como ustedes saben, al incrementar o disminuir las raíces por una
cantidad adecuada. Sea la ecuación puesta en la forma
,24 rqxpxx −−−=
y en cada lado sean añadidos los términos 222 yyx + , que contienen una nueva cantidad
indeterminada y, pero que aún así permiten que la parte izquierda de la ecuación
continúe siendo un cuadrado. Tendremos entonces
( ) ( ) .2 2222 ryqxxpyyx −+−−=+
Ahora debemos hacer que la parte derecha sea también un cuadrado. Para este fin, es
necesario que
( )( ) ,24 22 qrypy =−−
en cuyo caso la raíz cuadrada de la parte derecha tendrá la forma
58
.22
2py
qpyx
−−−
Suponiendo entonces que la cantidad y satisface la ecuación
( )( ) ,24 22 qrypy =−−
que desarrollada se convierte en
,0822
223 =−+−− qpr
rypy
y
y que, como podemos ver, es una ecuación de tercer grado; de esta manera, la ecuación
originalmente dada puede ser reducida a los siguiente al extraer la raíz cuadrada de sus
dos miembros, a saber:
,22
22
py
qpyxyx
−−−=+
donde podemos tomar cualquiera de los dos valores para el radical ,2 py − y
consecuentemente tendremos dos ecuaciones de segundo grado - a las que la ecuación
dada ha sido reducida -, y cuyas raíces nos darán las cuatro raíces de la ecuación
original.
Todo esto nos proporciona el primer caso de la descomposición de ecuaciones en otras
de menor grado.
El método de DESCARTES, que es comúnmente el seguido al estudiar los
elementos del álgebra, está basado en la misma idea, y consiste en asumir el principio
de que la ecuación propuesta es producida por la multiplicación de dos ecuaciones de
segundo grado, como
02 =+− suxx y ,02 =++ tuxx
donde u, s, y t son coeficientes indeterminados. Multiplicándolos conjuntamente,
tenemos
( ) ( ) ,024 =+−+−++ stuxtsxutsx
comparando esto con la ecuación original, tenemos
,2 puts =−+ ,)( quts =− .rst =
Las primeras dos ecuaciones dan
,2 2
u
qups ++= .2 2
u
qupt −+=
Y si estos valores son sustituidos en la tercera ecuación de condición rst = , tendremos
una ecuación de sexto grado en u, y que, debido a que contiene únicamente potencias
59
pares de u, es resoluble por las reglas para las ecuaciones cúbicas. Y si sustituimos en
esta ecuación py −2 por 2u , tendremos en y la misma ecuación reducida que
encontramos arriba gracias al viejo método.
Al tener el valor de 2u , tenemos también los valores de s y t, y nuestra ecuación
de cuarto grado será descompuesta en dos ecuaciones de segundo grado que nos darán
las cuatro raíces buscadas. Este método, así como el precedente, ha dado ocasión a
cierta indecisión acerca de cuál de las tres raíces de la ecuación cúbica reducida en 2u ó
y debe emplearse. La dificultad ha sido bien resuelta en el Algebra de Clairaut, en donde
podemos ver que siempre obtenemos las mismas cuatro raíces o valores de x sin
importar cuál raíz de la ecuación reducida empleemos. Pero esta generalidad es
innecesaria y perjudicial a la simplicidad deseable en la expresión de las raíces de la
ecuación propuesta, y debemos preferir las fórmulas que ustedes han estudiado en el
curso principal y en las que las tres raíces de la ecuación reducida están contenidas
exactamente en la misma manera.
Lo que sigue es otro método para alcanzar las mismas fórmulas, menos directo
que el que ya ha sido expuesto a ustedes, pero que tiene la ventaja de ser análogo al
método de Cardano para las ecuaciones de tercer grado.
Tomo de nuevo la ecuación
,024 =+++ rqxpxx
y suponemos que
.tzyx ++=
Elevando al cuadrado, obtenemos
).(22222 ztytyztzyx +++++=
Elevando otra vez al cuadrado, tenemos
( ) ( )( ) ( ) ;44 222222224 ztytyzztytyztzytzyx ++++++++++=
pero
( ) ).(2222 2222222222222222 tzyyzttztyzyyzttyzztytztyzyztytyz +++++=+++++=++
Sustituyendo estos tres valores de ,x ,2x y 4x en la ecuación original, y reuniendo los
términos multiplicados por tzy ++ y los términos multiplicados por ,ztytyz ++
tenemos la ecuación transformada
60
( ) ( ) ( )[ ]( )++++++++++++ ztytyzptzytzyptzy 24 2222222222
( ) ( )( ) .084 222222 =+++++++ rtzyqyzttztyzy
Ahora procedemos como lo hicimos con las ecuaciones de tercer grado, donde hicimos
que los términos que contenían zy + desaparecieran, y, de la misma forma, aquí
haremos que los términos que contengan tzy ++ , e ztytyz ++ desaparezcan, lo que
nos dará las dos ecuaciones de condición
08 =+ qyzt y ( ) .024 222 =+++ ptzy
Queda la ecuación
( ) ( ) ( ) ;04 2222222222222 =+++++++++ rtztyzytzyptzy
y las tres conjuntamente determinarán las cantidades y, z, y t. La segunda da de
inmediato
,2
222 ptzy −=++
que, sustituida en la tercera, produce
.416
2222222 rp
tztyzy −=++
La primera, elevada al cuadrado, da
.64
2222 q
tzy =
Por lo tanto, a partir de la teoría general de las ecuaciones, las tres cantidades ,2y ,2z
2t serán las raíces de una ecuación de tercer grado que tiene la forma
;0644162
2223 =−
−++ q
urp
up
u
de manera que, si a las tres raíces de esta ecuación, que llamaremos la ecuación
reducida, las designamos por a, b, y c, tendremos
ay = , ,bz = ,ct =
y el valor de x será expresado por
.cba ++
Debido a que cada uno de los tres radicales puede tomar el signo positivo o el negativo,
debemos tener, si son hechas todas las combinaciones posibles, ocho diferentes valores
para x. Debe observarse, sin embargo, que en el análisis precedente empleamos la
61
ecuación 64
2222 q
tzy = , mientras que la ecuación inmediatamente dada es .8
qyzt −= Por
lo tanto, el producto de las tres cantidades y, z, t, esto es, de los tres radicales
,a ,b c
debe tener el signo contrario al de la cantidad q. Entonces, si q es una cantidad negativa,
deben estar contenidos en la expresión para x o tres radicales positivos, o bien uno
positivo y dos negativos. Y en este caso tendremos únicamente las siguientes cuatro
combinaciones:
cba ++ , ,cba −−
,cba −+− ,cba +−−
y que serán las cuatro raíces de la ecuación de cuarto grado propuesta. Pero si q es una
cantidad positiva, deben estar contenidos en la expresión para x o tres radicales
negativos, o bien uno negativo y dos positivos, lo que nos dará las otras siguientes
cuatro combinaciones como las raíces de la ecuación propuesta:***
,cba −−− ,cba ++−
,cba +− .cba −+
Ahora bien, si las tres raíces a, b, c de la ecuación reducida de tercer grado son todas
reales y positivas, entonces es evidente que las cuatro raíces precedentes también serán
todas reales. Pero si entre las tres raíces reales a, b, c, cualesquiera son negativas,
entonces obviamente las cuatro raíces de la ecuación bicuadrada dada serán imaginarias.
Por esto, además de la condición para la realidad de las tres raíces de la ecuación
reducida, es también un requisito, de acuerdo con la bien conocida regla de
DESCARTES, que los coeficientes de los términos de la ecuación reducida sean
alternativamente positivos y negativos, y, consecuentemente, que p sea negativa y
*** Estas simples y elegantes fórmulas se deben a Euler. Pero M. Bret, profesor de matemáticas en Grenoble, ha hecho la importante observación (véase la Correspondance sur l’ Ecole Polytechnique, t. II, 3me Cahier, p. 217) de que pueden dar valores falsos cuando se utilizan cantidades imaginarias entre las cuatro raíces. Para eliminar cualquier dificultad y ambigüedad, simplemente tenemos que sustituir, por uno de
estos radicales, su valor como derivado de la ecuación .8
qcba −= Entonces la fórmula
ba
qba
8−+
dará las cuatro raíces de la ecuación original al tomar por a y b cualesquiera dos de las tres raíces de la ecuación reducida, y al tomar los dos radicales sucesivamente positivos y negativos. La observación precedente debe ser añadida al artículo 777 del Algebra de Euler y al artículo 37 de la Nota XIII del autor en el Traité de la résolution des équations numériques.
62
416
2 rp − positiva, esto es, p2>4r. Si una de estas condiciones no se cumple, la ecuación
bicuadrada propuesta no puede tener cuatro raíces reales. Si la ecuación reducida tiene
una sola raíz real, se verá, primero, que por razón de su último término siendo negativo,
la sola raíz real de la ecuación debe necesariamente ser positiva. Entonces es fácil ver a
partir de las expresiones generales que dimos para las raíces de ecuaciones cúbicas
privadas de su segundo término - una forma a la cual la ecuación reducida en u puede
ser fácilmente llevada al simplemente incrementar todas las raíces por la cantidad 6
p -,
es fácil ver, decía, que las dos raíces imaginarias de esta ecuación serán de la forma
1−+ gf y 1−− gf .
Por consiguiente, suponiendo que a sea la raíz real y b, c las dos raíces imaginarias, a
será una cantidad real y cb + también será real por las razones que dimos arriba;
mientras que, por el otro lado, cb − será imaginaria. De esto se sigue que de las
cuatro raíces de la ecuación bicuadrada propuesta, las dos primeras serán reales y las
otras dos serán imaginarias.
En cuanto al resto, si hacemos que 6
psu −= en la ecuación reducida en u, con
el fin de eliminar el segundo término y de reducirla a la forma que acabamos de
examinar arriba, debemos tener la siguiente ecuación transformada en s:
;06424864448
2323 =−+−
+− qprp
srp
s
y la condición para la realidad de las tres raíces de la ecuación reducida será
32
4484
+ rp
> .6424864
27223
+− qprp
63
LECCIÓN IV
SOBRE LA RESOLUCIÓN DE ECUACIONES NUMÉRICAS
Hemos visto cómo pueden resolverse ecuaciones de segundo, tercer, y cuarto grado. Las
ecuaciones de quinto grado constituyen una especie de barrera para los analistas, que
nunca han podido superar, incluso con grandes esfuerzos. La resolución general de este
tipo de ecuaciones es una de las cosas más deseables en el álgebra. Y digo en el álgebra,
porque si con las ecuaciones de tercer grado la expresión analítica de las raíces resulta
insuficiente para determinar, en todos los casos, su valor numérico, a fortiori debe
suceder lo mismo con las ecuaciones de mayor grado. Y de esta manera nos
encontramos constantemente bajo la necesidad de tener algún recurso a otros medios
para poder determinar numéricamente las raíces de una ecuación dada, porque el
determinar estas raíces es, en última instancia, el objetivo de la solución de todos los
problemas que ofrecen la necesidad o la curiosidad.
Me propongo establecer aquí los principales artificios que han sido ideados para
lograr este importante objetivo. Consideremos cualquier ecuación de grado m,
representada por la fórmula
,0...321 =+++++ −−− urxqxpxx mmmm
en donde x es la cantidad desconocida, p, q, r,…los coeficientes conocidos positivos o
negativos, y u el último término, que no contiene a x, y consecuentemente es también
una cantidad conocida. Se asume que los valores de estos coeficientes son dados o en
números o en líneas (esto es indiferente, ya que al tomar una línea dada como la unidad
o medida común del resto, podemos también asignar valores numéricos a todas las
líneas); y es claro que esta asunción es siempre permisible cuando la ecuación es el
resultado de un problema real y determinado. El problema es encontrar el valor, o, si
hay varios, los valores de x que satisfagan la ecuación, es decir, que hagan que la suma
de todos sus términos sea cero. Ahora bien, cualquier otro valor que pueda ser dado a x
hará esa suma igual a alguna cantidad positiva o negativa, y esto es porque solamente
potencias enteras de x entran en la ecuación, y, por lo tanto, es obvio que cada valor real
de x también dará un valor real para la cantidad en cuestión. Entre más se acerque ese
valor a cero, más se acercará el valor de x - que lo ha producido - a una raíz de la
64
ecuación. Y si encontramos dos valores de x, en donde uno de los cuales haga la suma
de los términos igual a una cantidad positiva, y el otro a una cantidad negativa, podemos
estar seguros de que entre estos dos valores habrá, por necesidad, por lo menos un valor
que hará que la expresión sea cero, y consecuentemente será una raíz de la ecuación.
Sea P la suma de todos los términos de la ecuación con el signo +, y Q la suma
de todos los términos con el signo .− Entonces la ecuación será representada por
.0=− QP
Supongamos, para simplificar aún más, que los dos valores de x en cuestión son
positivos, que A es el más pequeño, B el mayor, y que la sustitución de A por x da un
resultado negativo, y que la sustitución de B por x un resultado positivo; esto es, que el
valor de QP − es negativo cuando Ax = , y positivo cuando .Bx =
Consecuentemente, cuando Ax = , P será menor que Q, y cuando Bx = , P será
mayor que Q. Ahora bien, debido a la forma de las cantidades P y Q, que contienen
solamente términos positivos y potencias enteras positivas de x, es claro que estas
cantidades aumentan continuamente a medida que x aumenta, y que al hacer que x
aumente en grados insensibles a lo largo de todos los valores desde A a B, ellas también
aumentarán en grados insensibles pero de tal forma que P siempre crecerá más que Q,
viendo que, al haber sido menor a Q, se ha convertido en mayor. Por lo tanto,
necesariamente debe haber alguna expresión para el valor de x entre A y B que haga que
P = Q; así como dos cuerpos en movimiento que, suponiendo han viajado a lo largo de
la misma línea recta, y que, habiendo empezado simultáneamente desde dos puntos
diferentes, llegan simultáneamente a otros dos puntos, pero de tal forma que el cuerpo
que al principio estaba por detrás está ahora por delante del otro; así como dos cuerpos,
decía, deben necesariamente encontrarse en algún punto de su camino. Ese valor de x,
por lo tanto, que hará que P = Q, será una de las raíces de la ecuación, y tal valor estará
necesariamente entre A y B.
El mismo razonamiento puede emplearse para los otros casos, y siempre con el
mismo resultado.
La proposición en cuestión es también demostrable a partir de una consideración
directa de la ecuación por sí misma, que puede ser pensada como compuesta del
producto de los factores
,ax − ,bx − ,...,cx −
65
donde a, b, c,…son las raíces. Porque es obvio que este producto no puede, por la
sustitución de dos valores diferentes de x, hacer que cambie su signo, a menos que por
lo menos uno de los factores cambie su signo. Y es igualmente fácil ver que si más de
uno de los factores cambia su signo, su número será impar. Así, si A y B son dos valores
de x para que el factor bx − , por ejemplo, tenga signos opuestos, entonces si A es
mayor que b, necesariamente B debe ser menor que b, o viceversa. Entonces,
forzosamente, la raíz b se encontrará entre las dos cantidades A y B.
En cuanto a las raíces imaginarias, - si es que hay alguna en la ecuación - debido
a que se ha demostrado que siempre aparecen en pares y son de la forma
,1−+ gf ,1−− gf
por lo tanto, si a y b son imaginarias, el producto de los factores ax− y bx− será
( )( ) ( ) ,11 22 gfxgfxgfx +−=−+−−−−
una cantidad siempre positiva sea cual sea el valor dado a x. De esto se sigue que las
alternancias en el signo pueden deberse sólo a las raíces reales. Pero como el teorema
respectivo a la forma de las raíces imaginarias no puede ser rigurosamente demostrado
sin recurrir al otro teorema (el de que cada ecuación de un grado impar tiene
necesariamente una raíz real, un teorema cuya demostración general depende de la
proposición que nos ocupa probar), se sigue que la demostración debe ser considerada
como una especie de círculo vicioso, y que debe ser reemplazada por otra menos
expugnable.
Pero existe un método más general y sencillo para considerar ecuaciones, y que
tiene la ventaja de proporcionar una demostración directa de las principales propiedades
de las ecuaciones. Se basa en una especie de aplicación de la geometría al álgebra, y es
la más digna de exposición debido a su extenso uso en todas las ramas de las
matemáticas.
Tomemos de nuevo la ecuación general propuesta arriba, y representemos por
líneas rectas todos los valores sucesivos que son dados a la cantidad desconocida x, y
hagamos lo mismo para los valores correspondientes que, de esta manera, asume la
parte izquierda de la ecuación. Para este fin, en lugar de suponer que la parte derecha de
la ecuación es igual a cero, la supondremos igual a una cantidad indeterminada y.
Ponemos los valores de x sobre una línea recta indefinida AB (Fig. 1), empezando desde
un punto fijo 0, en el cual x es cero, y tomamos los valores positivos de x en la dirección
0B a la derecha de 0, y los valores negativos de x en la dirección opuesta, esto es, a la
66
izquierda de 0. Sea 0P cualquier valor de x. Para representar el valor correspondiente de
y, erigimos en P una perpendicular a la línea 0B y ponemos en ella el valor de y en la
dirección PQ, por encima de la línea recta 0B si es positiva, y en la misma perpendicular
por debajo de 0B si es negativa.
Fig. 1
Hacemos lo mismo para todos los valores de x, ya sean positivos o negativos; esto es,
ponemos valores correspondientes de y sobre perpendiculares a la línea recta a lo largo
de todos los puntos cuya distancia desde el punto 0 sea igual a x. Las extremidades††† de
todas estas perpendiculares formarán juntas una línea recta o una curva, que
proporcionará, por decirlo de alguna manera, una imagen de la ecuación
....21 yuqxpxx mmm =++++ −−
La línea AB es llamada el eje de la curva, 0 el origen de las abscisas, 0P = x una abscisa,
PQ = y la ordenada correspondiente, y las ecuaciones en x e y las ecuaciones de la
curva. Dada una curva como la que ha sido descrita en la Fig. 1, es obvio que sus
intersecciones con el eje AB darán las raíces de la ecuación propuesta
.0...21 =++++ −− uqxpxx mmm
Al ver que esta ecuación se realiza únicamente cuando en la ecuación de la curva y se
vuelve cero, los valores de x que satisfacen la ecuación en cuestión y que son sus raíces
††† Es decir, si tomamos como ejemplo la perpendicular PQ, los puntos equivalentes a Q. Nota del Traductor.
67
solamente pueden ser las abscisas que corresponden a los puntos en donde las ordenadas
son cero, esto es, a los puntos en donde la curva corta el eje AB. Así, suponiendo que la
curva de la ecuación en x y en y es la representada en la Fig. 1, las raíces de la ecuación
propuesta serán
0M, 0N, 0R,…y ,0I− ,...0G−
Doy el signo de menos a los últimos porque las intersecciones I, G,…están del otro lado
del punto 0. La consideración de la curva en cuestión da lugar a las siguientes
observaciones generales sobre las ecuaciones:
(1) Debido a que la ecuación de la curva contiene solamente potencias enteras y
positivas de la cantidad desconocida x, es obvio que a cada valor de x debe corresponder
un valor determinado de y, y que el valor en cuestión será único y finito mientras x sea
finita. Pero como no existe nada que limite los valores de x, éstos pueden ser supuestos
como infinitamente grandes - ya sea positivos o negativos - y a ellos corresponderán
valores de y que también serán infinitamente grandes. De donde se sigue que la curva
tendrá un curso único y continuo, y que puede ser extendida al infinito en ambos lados
del origen 0.
(2) También se sigue de esto que la curva no puede pasar de un lado del eje al
otro sin cortarlo, y que no puede regresar al mismo lado sin haberlo cortado dos veces.
Consecuentemente, entre cualesquiera dos puntos de la curva en el mismo lado del eje,
habrá necesariamente o ninguna intersección, o un número par de intersecciones; por
ejemplo, entre los puntos H y Q encontramos dos intersecciones I y M, y entre los
puntos H y S encontramos cuatro, I, M, N, R, etc. Por el contrario, entre un punto en un
lado del eje y un punto en el otro lado, la curva tendrá un número impar de
intersecciones; por ejemplo, entre los puntos L y Q hay una intersección M, y entre los
puntos H y K hay tres intersecciones, I, M, N, etc.
Por la misma razón, no puede haber una simple intersección, a menos que, a
ambos lados del punto de intersección - arriba y abajo del eje - los puntos de la curva
estén situados como lo están los puntos L, Q con respecto a la intersección M. Pero dos
intersecciones, tales como N y R, pueden aproximarse entre sí para, al final coincidir en
T. Entonces la ramificación QKS tomará la forma de la línea punteada QTS y tocará al
eje en T, y consecuentemente yacerá en toda su extensión por encima del eje; este es el
caso en el que las dos raíces 0N, 0R son iguales. Si tres intersecciones coinciden en un
punto - una coincidencia que ocurre cuando hay tres raíces iguales -, entonces la curva
68
cortará el eje solamente en un punto adicional, como en el caso de un único punto de
intersección, y así sucesivamente.
Consecuentemente, si hemos encontrado dos valores para y que tengan el mismo
signo, podemos estar seguros que entre los dos valores correspondientes de x solamente
puede haber un número par de raíces de la ecuación propuesta; esto es, que no habrá
ninguna, o que habrá dos, o cuatro, etc. Por otro lado, si hemos encontrado para y dos
valores que tengan signos contrarios, podemos estar seguros que entre los valores
correspondientes de x necesariamente habrá un número impar de raíces de la ecuación
propuesta; esto es, que habrá una, o habrá tres, o cinco, etc.; de modo que, para el caso
ahora mencionado, podemos inferir inmediatamente que habrá, por lo menos, una raíz
entre los dos valores de x para la ecuación propuesta.
A la inversa, cada valor de x que sea una raíz de la ecuación se encontrará entre
algún valor mayor y otro menor de x y que, al ser sustituido por x en la ecuación, dará
valores de y con signos contrarios.
Sin embargo, si el valor de x es una raíz doble, este no será el caso; esto es, si la
ecuación contiene dos raíces del mismo valor. Por otra parte, si el valor de x es una raíz
triple, de nuevo existirán un valor mayor y uno menor de x que dará signos contrarios a
los valores correspondientes de y, y así con el resto.
Si ahora consideramos la ecuación de la curva, es obvio, en primer lugar, que al
hacer que 0=x debemos tener ;uy = y, consecuentemente, que el signo de la ordenada
y será el mismo que el de la cantidad u, el último término de la ecuación propuesta.
También es fácil ver que se puede dar a x un valor positivo o negativo lo
suficientemente grande como para hacer que el primer término mx de la ecuación
exceda la suma de todos los otros términos que tienen el signo opuesto a ;mx con el
resultado de que el valor correspondiente de y tendrá el mismo signo que el primer
término .mx Ahora bien, si m es impar, mx será positiva o negativa dependiendo de si x
es positiva o negativa, y si m es par, mx será siempre positiva, independientemente de si
x es positiva o no. De esto podemos concluir lo siguiente:
(1) Que cada ecuación de un grado impar cuyo último término sea negativo,
tiene un número impar de raíces entre 0=x y algún valor positivo muy grande de x, y
un número par de raíces entre 0=x y algún valor negativo muy grande de x, y,
consecuentemente, que tiene, por lo menos, una raíz real positiva. Y que,
contrariamente, si el último término de la ecuación es positivo, tendrá un número impar
69
de raíces entre 0=x y algún valor negativo muy grande de x, y un número par de raíces
entre 0=x y algún valor positivo muy grande de x, y, consecuentemente, que tiene, por
lo menos, una raíz real negativa.
(2) Que cada ecuación de un grado par cuyo último término sea negativo, tiene
un número impar de raíces entre 0=x y algún valor positivo muy grande de x, así
como también un número impar de raíces entre 0=x y algún valor negativo muy
grande de x, y, consecuentemente, tendrá, por lo menos, una raíz real positiva y una raíz
real negativa. Y que, por otro lado, si el último término es positivo, habrá un número
par de raíces entre 0=x y algún valor positivo muy grande de x, y también un número
par de raíces entre 0=x y algún valor negativo muy grande de x; con el resultado de
que, en este caso, la ecuación podría no tener alguna raíz real, ya sea positiva o
negativa.
Hemos dicho que siempre se le puede dar a x un valor lo suficientemente grande
como para hacer que el primer término mx de la ecuación exceda la suma de todos los
términos de signo contrario. Esta proposición no necesita demostración, al ver que,
como la potencia mx es mayor que cualquiera de las otras potencias de x que entran en
la ecuación, se sigue que - a medida que x incrementa - incrementará mucho más rápido
que estas otras potencias; sin embargo, para no dejar dudas en la mente, debemos
ofrecer una demostración muy simple de esto. Esta demostración tendrá, además, la
ventaja de proporcionar un límite más allá del cual no podremos encontrar raíz alguna
para la ecuación.
Para este fin, supongamos primero que x es positiva, y que k es el mayor de los
coeficientes de los términos negativos. Si hacemos que 1+= kx , tendremos que
( ) ( ) ( ) .111 11 −− +++=+= mmmm kkkkx
De manera similar,
( ) ( ) ( )( ) ( ) ( ) ,111
,111332
221
−−−
−−−
+++=+
+++=+mmm
mmm
kkkk
kkkk
y así sucesivamente; de modo que, finalmente, tendremos
( ) ( ) ( ) ( ) .1...1111 321 ++++++++=+ −−− kkkkkkkk mmmm
Ahora, esta cantidad es evidentemente mayor que la suma de todos los términos
negativos de la ecuación tomados positivamente, en la suposición de que .1+= kx Por
lo tanto, la suposición 1+= kx hace necesariamente al primer término mx mayor que la
70
suma de todos los términos negativos. Consecuentemente, el valor de y tendrá el mismo
signo que x.
El mismo razonamiento y el mismo resultado valen cuando x es negativa. Si este
es el caso, simplemente tenemos que cambiar x en x− para la ecuación propuesta, para,
de esta forma, cambiar las raíces positivas en raíces negativas, y viceversa.
De la misma manera, se puede probar que si asignamos cualquier valor a x
mayor que ,1+k el valor de y tendrá todavía el mismo signo. De esto y de lo que se ha
dicho arriba, inmediatamente se sigue que la ecuación no puede tener una raíz igual o
mayor que .1+k
Por consiguiente, y de manera general, si k es el mayor de los coeficientes de los
términos negativos de una ecuación, y, si al cambiar la cantidad desconocida x en x− , h
es el mayor de los coeficientes de los términos negativos de la nueva ecuación -
suponiendo siempre que el primer término es positivo -, entonces todas las raíces reales
de la ecuación estarán necesariamente comprendidas entre los límites
1+k y .1−− h
Pero si en la ecuación hay varios términos positivos precediendo al primer
término negativo, podemos tomar para k una cantidad menor que el mayor coeficiente
negativo. En realidad, es fácil ver que la fórmula dada arriba puede ser puesta en la
forma
( ) ( )( ) ( )( ) ( )232 1...11111 ++++++++=+ −− kkkkkkkk mmm
y similarmente en lo siguiente
( ) ( ) ( ) ( ) ( ) ( )34232 1...11111 ++++++++=+ −− kkkkkkkk mmm
y así sucesivamente.
Por lo cual, es fácil inferir que si nm− es el exponente del primer término
negativo de la ecuación de m grado propuesta, y si l es el mayor coeficiente de los
términos negativos, será entonces suficiente que k sea determinada de manera que
( ) .1 1 lkk n =+ −
Y como podemos tomar para k cualquier valor mayor que queramos, será suficiente con
tomar
,lkn = ó .n lk =
Y lo mismo será válido para la cantidad h como el límite de las raíces negativas.
71
Si ahora cambiamos la cantidad desconocida x a ,1
z las raíces más grandes de la
ecuación en x serán convertidas en las más pequeñas en la nueva ecuación en z, y a la
inversa. Habiendo hecho esta transformación, y habiendo arreglado los términos de
acuerdo con las potencias de z, para que el primer término de la ecuación sea ,mz
podemos entonces buscar, de la misma manera, por los límites 1+K y 1−− H de las
raíces positivas y negativas de la ecuación en z.
Así, al ser 1+K mayor que el mayor valor de z o de ,1
x se sigue que, por la
naturaleza de las fracciones, 1
1
+K será menor que el menor valor de x; y, similarmente,
1
1
+H será menor que el menor valor negativo de x.
De donde se puede inferir que todas las raíces reales positivas estarán
comprendidas necesariamente entre los límites
1
1
+K y ,1+k
y que las raíces reales negativas estarán entre los límites
1
1
+−
H y .1−− h
Existen otros métodos encaminados a encontrar límites más cercanos, pero como
requieren de un trabajo considerable, el método precedente es, en la mayoría de los
casos, preferible, ya que es más simple y conveniente.
Por ejemplo, si en la ecuación propuesta zl + es sustituido por x, y si después de
haber arreglado los términos de acuerdo con las potencias de z, se le da a l un valor tal
que los coeficientes de todos los términos se vuelven positivos, es obvio que entonces
no habrá valor positivo de z que pueda satisfacer la ecuación. La ecuación tendrá
solamente raíces negativas, y, consecuentemente, l será una cantidad mayor que el
mayor de los valores de x. Ahora, es fácil ver que estos coeficientes serán expresados
como sigue:
,mlp +
( ) ( ),
2
11 2l
mmplmq
−+−+
( ) ( )( ) 2
2
212 pl
mmqlmr
−−+−+
72
( )( ),
3.2
21 3lmmm −−+
etc. En consecuencia, sólo es necesario buscar, por ensayo, el valor más pequeño de l
que los hará a todos positivos.
Pero en la mayoría de los casos no es suficiente con conocer los límites de las
raíces de una ecuación, sino lo importante es conocer los valores de estas raíces, por lo
menos de manera tan aproximada como las condiciones del problema lo requieran.
Porque cada problema conduce - en su último análisis - a una ecuación que contiene su
solución; y si no está en nuestras manos el resolver esta ecuación, todos los esfuerzos
puestos en su formulación son una pérdida total. Podemos considerar a este punto, por
lo tanto, como el más importante en todo el análisis, y es por esta razón por la que me
sentí obligado a hacerlo el tema principal de la presente lectura.
A partir de los principios establecidos arriba, referentes a la naturaleza de la
curva cuyas ordenadas y representan todos los valores que asume la parte izquierda de
una ecuación, se sigue que, si poseyéramos algunos medios para describir esta curva,
obtendríamos, de manera inmediata - debido a sus intersecciones con el eje - todas las
raíces de la ecuación propuesta. Pero para este propósito no es necesario considerar toda
la curva; es suficiente con conocer las partes que yacen - de manera inmediata - arriba y
debajo de cada punto de la intersección. Es posible encontrar tantos puntos de una curva
como queramos, y tan cerca unos de otros como queramos, al sustituir sucesivamente
por x números que tienen muy poca diferencia entre ellos, pero que, aún así, están lo
suficientemente cerca de nuestro propósito, y al tomar para y los resultados de estas
sustituciones en la parte izquierda de la ecuación. Si entre los resultados de estas
sustituciones se encuentran dos que tengan signos contrarios, podemos estar seguros,
debido a los principios establecidos arriba, de que entre estos dos valores de x habrá -
por lo menos - una raíz real. Y después podemos - a partir de nuevas sustituciones -
juntar estos dos límites todavía más y aproximarnos, tanto como queramos, a las raíces
buscadas.
Si llamamos al menor de los valores de x que han dado resultados con signos
contrarios A, y al mayor B, y suponiendo que queremos encontrar el valor de la raíz
dentro de un grado de exactitud denotado por n, donde n es una fracción de cualquier
grado de pequeñez que deseemos, procedemos a sustituir para x, de manera sucesiva, los
siguientes números en progresión aritmética:
,nA+ ,2nA+ ,...,3nA+
73
o
,nB − ,2nB − ,...,3nB −
hasta que se llegue a un resultado que tenga el signo contrario al obtenido por la
sustitución de A o de B. Entonces, uno de los dos valores sucesivos de x que han dado
resultados con signo contrario será necesariamente mayor que la raíz buscada, y el otro
menor; y como, por hipótesis, estos valores difieren uno del otro sólo por la cantidad n,
se sigue que cada uno de ellos se aproxima a la raíz buscada por menos de n, y que el
error es, por lo tanto, menor que n.
¿Pero cómo deben ser determinados los valores iniciales sustituidos por x, de tal
manera que, por una parte, podamos evitar tantos ensayos inútiles como sea posible, y,
por otra, estar seguros de que por este método hemos descubierto todas las raíces reales
de esta ecuación? Si examinamos la curva de la ecuación, se verá fácilmente que la
cuestión se resuelve por sí misma al seleccionar los valores de x de tal forma que por lo
menos uno de ellos esté entre dos intersecciones adyacentes. Y este será necesariamente
el caso si la diferencia entre dos valores consecutivos es menor que la menor distancia
entre dos intersecciones adyacentes.
Así, si suponemos que D es una cantidad menor que la menor distancia entre dos
intersecciones que se siguen inmediatamente una de la otra, podemos formar la
siguiente progresión aritmética
,0 ,D ,2D ,3D ,...,4D
y de esta progresión seleccionamos únicamente los términos que se encuentren entre los
límites
1
1
+K y ,1+k
como fueron determinados por el método ya expuesto. De esta manera, obtenemos
valores que, al ser sustituidos por x, finalmente nos darán todas las raíces positivas de la
ecuación, y, al mismo tiempo, nos darán los límites iniciales de cada raíz. De la misma
manera, formamos la siguiente progresión para obtener las raíces negativas
,0 ,D− ,2D− ,3D− ,...,4D−
de la cual también consideramos únicamente los términos comprendidos entre los
límites
1
1
+−
H y .1−− h
74
Así, se resuelve la dificultad. Pero todavía nos queda encontrar la cantidad D,
esto es, una cantidad menor que el menor intervalo entre cualesquiera dos intersecciones
adyacentes de la curva con el eje. Debido a que las abscisas que corresponden a las
intersecciones son las raíces de la ecuación propuesta, es claro que la cuestión se reduce
a encontrar una cantidad menor que la menor diferencia entre dos raíces, obviando (o no
considerando, pues) los signos. Por lo tanto, tenemos que buscar - a partir de los
métodos que fueron discutidos en las lecciones del curso principal - la ecuación cuyas
raíces sean las diferencias entre las raíces de la ecuación propuesta. Y después debemos
buscar - por los métodos expuestos arriba - una cantidad menor que la menor raíz de
esta última ecuación, y tomar esa cantidad como el valor de D.
Este método, como podemos ver, no deja nada que desear en lo que respecta a
proporcionar una solución rigurosa del problema, pero tiene la gran desventaja de
requerir, para este fin, cálculos extremadamente grandes, especialmente si la ecuación
propuesta es de una grado muy grande. Por ejemplo, si m es el grado de la ecuación
original, el de la ecuación de diferencias será ( ),1−mm porque cada raíz puede ser
sustraída de todas las raíces restantes, cuyo número es ,1−m lo que da ( )1−mm
diferencias. Pero como cada diferencia puede ser positiva o negativa, la ecuación de
diferencias debe tener las mismas raíces tanto en una forma positiva como en una
negativa; consecuentemente, la ecuación será defectuosa en todos los términos en los
que la cantidad desconocida sea elevada a una potencia impar; de manera que, al tomar
el cuadrado de las diferencias como la cantidad desconocida, ésta solamente puede
ocurrir en el grado ( )
.2
1−mm De acuerdo con esto, es necesaria para una ecuación de
grado m - al comienzo - una ecuación transformada de grado ( )
,2
1−mm que requiere
una enorme cantidad de trabajo tedioso si m es grande. Por ejemplo, para una ecuación
de grado 10, la ecuación transformada será de grado 45. Y como en la mayoría de los
casos esta desventaja hace que el método sea impracticable, resulta de gran importancia
encontrar los medios para remediar esto.
Para este fin, resumamos la ecuación propuesta de grado m,
,0...21 =++++ −− uqxpxx mmm
de la cual las raíces son a, b, c,…Tendremos, entonces que
0...21 =++++ −− uqapaa mmm
75
y también que
.0...21 =+++ −− uqbpbb mmm
Sea .iab =− Sustituimos este valor de b en la segunda ecuación, y, después de
desarrollar las diferentes potencias de ia + de acuerdo con el conocido teorema del
binomio, arreglamos la ecuación resultante de acuerdo con las potencias de i,
empezando con la más baja. Debemos tener la siguiente ecuación transformada
,0...2 =++++ miRiQiP
en donde los coeficientes P, Q, R,…tienen los siguientes valores
,...21 uqapaaP mmm ++++= −−
( ) ( ) ...21 321 +−+−+= −−− mmm qampammaQ
( ) ( )( ) ( )( )...
2
32
2
21
2
1 432 +−−+−−+−= −−− mmm qamm
pamm
amm
R
y así sucesivamente. La ley de transformación de estas expresiones es evidente.
Ahora bien, por la primera ecuación en a, tenemos .0=P Eliminando, por lo
tanto, al término P de la ecuación en i y dividiendo todos los términos restantes por i, la
ecuación en cuestión es reducida al grado ( )1−m , y tendrá la siguiente forma
.0... 12 =++++ −miSiRiQ
Esta ecuación tendrá para sus raíces las diferencias 1−m entre la raíz a y las
raíces restantes b, c,…De manera similar, si b es sustituido por a en las expresiones para
los coeficientes Q, R,…, obtendremos una ecuación cuyas raíces son la diferencia entre
la raíz b y las raíces restantes a, c,…, y así sucesivamente.
De acuerdo con esto, si podemos encontrar una cantidad menor que la raíz
menor de todas estas ecuaciones, poseerá la propiedad requerida y puede ser tomada
como la cantidad D, cuyo valor estamos buscando.
Si, por medio de la ecuación ,0=P a es eliminada de la ecuación en i, debemos
tener una nueva ecuación en i que contenga todas las otras ecuaciones de las que hemos
hablado, y en donde solamente será necesario buscar la raíz más pequeña. Pero esta
nueva ecuación en i no es nada más que la ecuación de diferencias de la que hemos
estado tratando de prescindir.
Pongamos la ecuación de arriba en i como .1
zi = Tendremos, entonces, la
siguiente ecuación transformada en z,
76
,01
...321 =++++ −−−
Qz
Q
Sz
Q
Rz mmm
y el mayor coeficiente negativo de esta ecuación dará, por lo que se ha demostrado
arriba, una valor mayor que su mayor raíz; de manera que, si llamamos L a este
coeficiente mayor, 1+L será una cantidad mayor que el mayor valor de z.
Consecuentemente, 1
1
+L será una cantidad menor que el menor valor positivo de i; y, a
partir de una manera parecida, encontraremos una cantidad menor que la menor
cantidad negativa de i. De acuerdo con esto, podemos tomar por D a la menor de estas
dos cantidades, o a alguna cantidad menor que cualquiera de ellas.
Para un resultado más simple, y que, además, es independiente de los signos,
podemos reducir la cuestión a encontrar una cantidad L que sea numéricamente mayor
que cualquiera de los coeficientes de la ecuación en z, y es evidente que si encontramos
una cantidad N numéricamente menor que el menor valor de Q, y una cantidad M
numéricamente mayor que el mayor valor de cualquiera de las cantidades R, S,…,
podemos decir que .N
ML =
Comencemos por encontrar los valores de M. No es difícil demostrar - por los
principios establecidos arriba -, que si 1+k es el límite de las raíces positivas y 1−− h
el límite de las raíces negativas de la ecuación propuesta, y 1+k y 1−− h son
sucesivamente sustituidos por a en las expresiones por R, S,…, - considerando
únicamente los términos que tienen el mismo signo como el primero - obtendremos
cantidades que son mayores que los mayores valores positivos y negativos de R,
S,…,correspondientes a las raíces a, b, c,…, de la ecuación propuesta; de manera que
podemos tomar para M la cantidad que numéricamente es la mayor de estas.
Sólo nos queda encontrar un valor menor que el menor valor de Q. Parece ser
que únicamente podemos conseguir esto si empleamos la ecuación cuyos diferentes
valores de Q son las raíces; una ecuación que sólo podemos conseguir si eliminamos a
de las siguientes ecuaciones:
,0...21 =++++ −− uqapaa mmm
( ) ( ) ....21 321 Qqampamma mmm =+−+−+ −−−
Puede ser fácilmente demostrado - a partir de la teoría de la eliminación - que la
ecuación resultante en Q será de grado m, esto es, del mismo grado que la ecuación
propuesta; y también puede ser demostrado - a partir de la forma de las raíces de esta
77
ecuación - que no habrá un siguiente al último término. Si, de acuerdo con esto,
buscamos - a partir del método expuesto arriba - una cantidad numéricamente menor
que la menor raíz de esta ecuación, esta cantidad encontrada puede ser considerada
como N. Por lo tanto, el problema es resuelto por medio de una ecuación del mismo
grado que la ecuación propuesta.
El resultado de todo esto es como sigue (por razones de simplicidad conservo la
letra x en lugar de la letra a).
Sea lo siguiente la ecuación de grado m propuesta:
;0...321 =++++ −−− mmmm rxqxpxx
sea k el mayor coeficiente de los términos negativos, y nm− el exponente de x en el
primer término negativo. Similarmente, sea h el mayor coeficiente de los términos que
tienen un signo contrario al primer término después de que x haya sido cambiada a ;x−
y sea 'nm− el exponente de x en el primer término que tenga un signo contrario al
primer término de la ecuación así alterada. Poniendo, entonces
n kf 1+= y ,1'n hg +=
tendremos a f y a g− como los límites de las raíces positivas y negativas. Estos
límites son después sustituidos sucesivamente por x en las siguientes fórmulas,
omitiendo los términos que tienen el mismo signo como el primer término:
( ) ( )( )
( )( )...,
2
322
21
2
1
4
32
+−−+
−−+−
−
−−
m
mm
qxmm
pxmm
xmm
( )( )
( )( )( )...,
3.2
3213.2
21
4
3
+−−−+
−−
−
−
m
m
pxmmm
xmmm
y así sucesivamente. De estas fórmulas habrá .2−m Sea M la mayor de las cantidades
numéricas obtenidas de esta forma. Después tomamos la ecuación
( ) ( ) ( ) yrxmqxmpxmmx mmmm =+−+−+−+ −−−− ...321 4321
y eliminamos x de ella por medio de la ecuación propuesta, lo que nos da una ecuación
en y de grado m en donde falta lo siguiente al último término. Sea V el último término
de esta ecuación en y, y T el mayor coeficiente de los términos que tienen signo
contrario a V, suponiendo a y tanto positiva como negativa. Después, tomando a estas
dos cantidades T y V como positivas, N será determinada por la ecuación
78
n
T
V
N
N =−1
,
donde n es igual al exponente del último término con signo contario a V. Después
tomamos a D como igual o menor que la cantidad ,NM
N
+ e interpolamos la progresión
aritmética:
,0 ,D ,2D ,...,3D ,D− ,2D− ,...3D−
entre los límites f y .g− Los términos de estas progresiones - al ser sucesivamente
sustituidos por x en la ecuación propuesta - revelarán todas las raíces reales, tanto
positivas como negativas, por los cambios de signo en la serie de resultados producidos
por estas sustituciones, y darán, al mismo tiempo, los primeros límites de estas raíces -
límites que, como ya sabemos, pueden ser tan reducidos como queramos -.
Si el último término V de la ecuación en y resultante de la eliminación de x es
cero, entonces N será cero, y, consecuentemente, D será igual a cero. Pero en este caso
es claro que la ecuación en y tendrá una raíz igual a cero e incluso dos, porque falta lo
siguiente al último término. Por consiguiente, la ecuación
( ) ( ) 0...21 321 =+−+−+ −−− mmm qxmpxmmx
será válida al mismo tiempo con la ecuación propuesta. Debido a esto, estas dos
ecuaciones tendrán un común divisor, que puede ser encontrado por el método
ordinario, y que, puesto igual a cero, dará una o varias raíces de la ecuación propuesta, y
que serán dobles o múltiples, como es evidente debido a la teoría precedente; si el
último término Q de la ecuación en i es cero, se sigue que
0=i y .ba =
La ecuación en y es reducida, debido a la desaparición de su último término, al grado
2−m , siendo, pues, divisible por .2y Si después de esta división su último término
sigue siendo cero, será una indicación de que tiene más de dos raíces iguales a cero, y
así sucesivamente. En tal caso, debemos dividirla entre y tantas veces como sea
posible, y después tomar su último término como V, y el mayor coeficiente de los
términos de signo contrario a V como T, con el fin de obtener el valor de D, que nos
permitirá encontrar todas las raíces restantes de la ecuación propuesta. Si la ecuación
propuesta es de tercer grado, como
,03 =++ rqxx
debemos tener, para la ecuación en y,
79
.02743 2323 =−−+ rqqyy
Si la ecuación propuesta es
024 =+++ srxqxx
debemos tener, para la ecuación en y, lo siguiente:
( )027414416
12825618164843224
22322334
=−−++−++−++
rqrsqrsq
qssyrqsqryy
y así sucesivamente.
Ya que, sin embargo, el encontrar la ecuación en y por los métodos ordinarios de
eliminación puede resultar en extremo difícil, proporciono aquí las fórmulas generales
para tal propósito, derivadas de las propiedades conocidas de las ecuaciones. Primero,
formamos, a partir de los coeficientes p, q, r de la ecuación propuesta, las cantidades x1,
x2, x3,…, de la siguiente manera:
x1 = ,p−
x2 = p− x1 ,2q−
x3 = p− x2 q− x1 r3− ,
……………………………
Después sustituimos en las expresiones por y, ,2y 3y ,… hasta my - después de que los
términos en x han sido desarrollados - las cantidades x1 por x, x2 por ,2x x3 por 3x , etc.,
y designamos por y1, y2, y3…los valores de y, ,2y 3y ,…resultantes de estas
sustituciones. Después, simplemente tenemos que formar las cantidades A, B, C a partir
de las fórmulas
,1yA =
,2
21 yAyB
−=
,3
321 yAyByC
+−=
………………………………,
y tendremos la siguiente ecuación en y:
.0...321 =+−+− −−− mmmm CyByAyy
El valor, o más bien el límite de D, que encontramos por el método expuesto, a
menudo puede ser mucho más pequeño de lo que es necesario para encontrar todas las
raíces, pero no habrá más inconvenientes en esto que el tener que incrementar el número
80
de sustituciones sucesivas por x en la ecuación propuesta. Además, cuando hay tantos
resultados encontrados como unidades en el exponente más grande de la ecuación,
podemos continuar estos resultados tanto como queramos por la simple adición de la
primera, segunda, tercera diferencias, etc., porque las diferencias del orden
correspondiente al grado de la ecuación son siempre constantes.
Hemos visto antes cómo la curva de la ecuación propuesta puede ser construida
al dar sucesivamente diferentes valores a las abscisas x y tomar por las ordenadas y los
valores resultantes de estas sustituciones en la parte izquierda de la ecuación. Pero estos
valores para y también pueden ser encontrados a partir de otra construcción sumamente
simple, y que requiere ahora nuestra atención. Representemos la ecuación propuesta por
0...32 =++++ dxcxbxa
donde los términos están tomados en el orden inverso. La ecuación de la curva será,
entonces
....32 ++++= dxcxbxay
Fig. 2
Trazando (Fig. 2) la línea recta 0X, que tomamos como el eje de las abscisas con 0
como origen, desplegamos en esta línea el segmento 0I, igual a la unidad en términos
por la cual suponemos deben ser expresados las cantidades a, b, c,…; y erigimos en los
puntos 0I las perpendiculares 0D, IM. Después, desplegamos en la línea 0D los
segmentos
81
0A = a, AB = b, BC = c, CD = d,...,
etc. Sea 0P = x, y en el punto P erijamos la perpendicular PT. Supongamos, por
ejemplo, que d es el último de los coeficientes a, b, c,…, de manera que la ecuación
propuesta es solamente de tercer grado, y que el problema es encontrar el valor de
.32 dxcxbxay +++=
Siendo el punto D el último de los puntos determinados sobre la perpendicular 0D, y el
punto C el penúltimo, trazamos a lo largo de D la línea DM paralela al eje 0I, y a lo
largo del punto M, donde esta línea corta la perpendicular IM, trazamos la línea recta
CM conectando M con C. Después, a lo largo del punto S, donde esta última línea recta
corta la perpendicular PT, trazamos HSL paralela a 0I, y a lo largo del punto L, donde
esta paralela corta la perpendicular IM, trazamos, hasta el punto B, la línea recta BL. De
manera similar, a lo largo del punto R, donde esta última línea corta la perpendicular
PT, trazamos GRK paralela a 0I, y a lo largo del punto K, donde esta paralela corta la
perpendicular IM, trazamos, al primer punto de división A de la perpendicular D0, la
línea recta AK. El punto Q, donde esta línea recta corta la perpendicular PT, dará el
segmento PQ = y.
A lo largo de Q, trazamos la línea FQ, paralela al eje 0P. Los dos triángulos
similares CDM y CHS dan
DM(1): DC(d) = HS(x): CH(= dx).
Añadiendo CB © tenemos
BH = c + dx.
También los dos triángulos similares BHL y BGR dan
HL(1): HB(c + dx) = GR(x): BG(= cx + dx2).
Añadiendo AB (b), tenemos que
AG = b + cx + dx2.
Finalmente, los triángulos similares AGK y AFQ dan
GK(1): GA(b + cx + dx2) = FQ (x): FA(=bx + cx2 +dx3),
y obtenemos, al añadir 0A (a)
0F = PQ = a + bx + cx2 + dx3 = y.
La misma construcción y la misma demostración son válidas, sin importar cuál
sea el número de términos en la ecuación propuesta. Cuando hay coeficientes negativos
entre a, b, c,…, simplemente es necesario tomarlos en la dirección opuesta a la de los
coeficientes positivos. Por ejemplo, si a fuese negativa, tendríamos que poner el
82
segmento 0A por debajo del eje 0I. Después empezaríamos desde el punto A y le
añadiríamos el segmento AB = b. Si b fuese positiva, AB tendría que ser tomado en la
dirección 0D; pero si b fuese negativa, AB tendría que ser tomada en la dirección
opuesta, y así con el resto.
Con lo que respecta a x, 0P es tomada en la dirección de 0I, que se supone igual
a la unidad positiva, cuando x es positiva; pero en la dirección opuesta cuando x es
negativa.
No sería difícil construir, en el modelo precedente, un instrumento que fuera
aplicable a todos los valores de los coeficientes a, b, c,…, y que, por medio de un
número de reglas móviles y propiamente conjuntadas, diera, para cada punto P de la
línea recta 0P, el correspondiente punto Q, y que incluso pudiese ser esto hecho por un
movimiento continuo para describir la curva. Tal instrumento podría ser usado para
resolver ecuaciones de cualquier grado; por lo menos podría ser usado para encontrar
los primeros valores aproximados de las raíces, y a partir de lo cual, después, poder
encontrar valores más exactos.
83
LECCIÓN V
SOBRE EL EMPLEO DE CURVAS EN LA SOLUCIÓN
DE PROBLEMAS
Todo el tiempo que el álgebra y la geometría recorrieron caminos distintos, su
avance fue lento y sus aplicaciones limitadas. Pero cuando estas dos ciencias se unieron,
cada una extrajo de la otra una nueva y fresca vitalidad, y, a partir de entonces, se
acercaron a la perfección. Es a DESCARTES a quien debemos la aplicación del álgebra
en la geometría, - una aplicación que ha hecho posible llevar a cabo los mayores
descubrimientos en todas las ramas de las matemáticas -. El método que recién expuse
para encontrar y demostrar diversas propiedades generales de las ecuaciones al
considerar las curvas que las representan, es, propiamente hablando, una especie de
aplicación de la geometría al álgebra, y como este método ha extendido sus
aplicaciones, y es capaz de resolver fácilmente problemas cuya solución directa sería en
extremo difícil o incluso imposible, considero que es adecuado atraer su atención en
esta lección con una indagación más profunda sobre este tema, y más considerando que
no se encuentra comúnmente en los trabajos elementales de álgebra.
Ustedes han visto cómo una ecuación de cualquier grado puede ser resuelta por
medio de una curva, de la cual las abscisas representan la cantidad desconocida de la
ecuación, y las ordenadas los valores que la parte izquierda asume para cada valor de la
cantidad desconocida. Es evidente que este método puede ser aplicado - de manera
general - a todas las ecuaciones, sea cual sea su forma, y solamente se requiere que éstas
sean desarrolladas y acomodadas de acuerdo con las diferentes potencias de la cantidad
desconocida. Simplemente es necesario llevar todos los términos de la ecuación a un
lado, de tal forma que el otro lado sea igual a cero. Después, tomar la cantidad
desconocida por la abscisa x, y la función de la cantidad desconocida, o la cantidad
compuesta de esa cantidad y las cantidades conocidas - que forma una parte de la
ecuación - por la ordenada y; la curva descrita por estas coordenadas x e y dará, por las
intersecciones con el eje, aquellos valores de x que son las raíces requeridas de la
ecuación. Y como frecuentemente no es necesario conocer todos los posibles valores de
la cantidad desconocida sino sólo aquellos que resuelven el problema con el que se está
84
tratando, será suficiente con describir aquella porción de la curva que corresponde a
estas raíces, evitando así muchos cálculos innecesarios. De esta manera, incluso
podemos determinar, a partir de la forma de la curva, si el problema tiene soluciones
posibles que satisfagan las condiciones propuestas.
Supongamos, por ejemplo, que queremos encontrar, en la línea que une dos
puntos luminosos de una intensidad dada, el punto que recibe una cantidad dada de luz,
siendo esta ley física la que establece que la intensidad de luz decrece con el cuadrado
de la distancia.
Sea a la distancia entre las dos luces y x la distancia entre el punto buscado y una
de las luces, cuya intensidad en unidad de distancia es M, y la intensidad de la otra en
esa distancia es N. Las expresiones 2x
M y ( ) ,
2xa
N
−en consecuencia, darán la intensidad
de las dos luces en el punto en cuestión, de manera que, al designar el efecto total dado
por A, tenemos la ecuación
( ) Axa
N
x
M =−
+22
o
( ) .022
=−−
+ Axa
N
x
M
Consideraremos ahora a la curva teniendo la ecuación
( ) yAxa
N
x
M =−−
+22
en donde inmediatamente se verá que, al dar a x un valor muy pequeño, positivo o
negativo, el término 2x
M, mientras continúa siendo positivo, crecerá mucho, porque una
fracción incrementa en proporción a medida que su denominador decrece, y será infinita
cuando .0=x Además, si x incrementa, la expresión 2x
M disminuirá de manera
constante; pero la otra expresión ( )2xa
N
−, que era
2a
N cuando ,0=x se incrementará
de manera constante hasta que se vuelva muy grande o infinita cuando x tenga un valor
muy cercano o igual a a.
De acuerdo con esto, si, al dar a x valores desde cero a a, se puede hacer que la
suma de estas expresiones sea menor que la cantidad dada A, entonces el valor de y, que
85
al principio era muy grande y positivo, será negativo, y, más tarde, de nuevo será muy
grande y positivo. Consecuentemente, la curva cortará dos veces al eje entre las dos
luces, y el problema tendrá dos soluciones. Éstas son reducibles a una simple ecuación
si el menor valor de
( )22 xa
N
x
M
−+
es exactamente igual a A, y serán imaginarias si ese valor es mayor que A, porque
entonces el valor de y será siempre positivo desde 0=x a .ax = De esto resulta
evidente que si una de las condiciones del problema es que el punto requerido se
encuentre entre las dos luces, es posible que el problema no tenga solución. Pero si se
permite al punto estar en la prolongación de la línea que une a las dos luces, veremos
que el problema es siempre resoluble de dos maneras. De hecho, suponiendo que x sea
negativa, es obvio que el término 2x
M permanecerá siempre positivo, y, de ser muy
grande cuando x es cercana a cero, comenzará a decrecer y continuará haciéndolo a
medida que x se incrementa, hasta que se vuelva muy pequeño o incluso cero cuando x
sea muy grande o infinita.
El otro término ( ) ,2xa
N
−que al principio era igual a
2a
N, también disminuye hasta que
se vuelve cero cuando x es infinitamente negativa. Será lo mismo si x es positiva y
mayor que a; porque cuando ax = , la expresión ( )2xa
N
− será infinitamente grande;
después, continuará decreciendo hasta que se vuelva cero cuando x sea infinita, mientras
que la otra expresión 2x
M será primero igual a
2a
M, y también continuará disminuyendo
hacia cero a medida que x incrementa.
Por lo tanto, cualquiera sea el valor de la cantidad de A, es obvio que los valores
de y necesariamente pasarán de positivo a negativo, tanto cuando x sea negativa como
cuando sea positiva y mayor que a. De acuerdo con esto, habrá un valor negativo de x y
un valor positivo de x mayor que a que resolverá el problema para todos los casos. Estos
valores pueden ser encontrados por el método general al sucesivamente causar que los
valores de x - que dan valores de y con signos contrarios - se aproximen cada vez más
entre ellos.
86
Con respecto a los valores de x que son menores que a, hemos visto que la
realidad de estos valores depende del menor valor de la cantidad
( ) .22 xa
N
x
M
−+
Las direcciones para encontrar a los menores y mayores valores de cantidades variables
están dadas en el cálculo diferencial. Aquí nos contentaremos con remarcar que la
cantidad en cuestión será un mínimo cuando
;3
N
M
xa
x =−
de tal manera que tendremos
,3 3
3
NM
Max
+=
de donde obtendremos, como el menor valor de la expresión
( ) ,22 xa
N
x
M
−+
la cantidad
( ).
2
333
a
NM +
Por lo tanto, habrá dos valores reales para x si esta cantidad es menor que A; pero estos
valores serán imaginarios si es mayor. El caso de igualdad dará dos valores iguales para
x.
He ocupado un tiempo considerable en el análisis de este problema (aunque por
sí mismo sea de gran importancia), porque puede servir para la resolución de casos
análogos.
La ecuación del problema precedente, habiendo sido liberada de fracciones,
asume la siguiente forma:
( ) ( ) .02222 =−−−− NxxaMxaAx
Con sus términos desarrollados y propiamente arreglados, se verá que es una ecuación
de cuarto grado y que, consecuentemente, tiene cuatro raíces. Ahora bien, por el análisis
que acabamos de hacer, podemos reconocer, de manera inmediata, el carácter de estas
raíces. Y como de esta consideración puede surgir un método aplicable a todas las
ecuaciones de cuarto grado, haremos, de paso, unas pocas y pequeñas consideraciones
sobre ella.
87
Sea la ecuación general
.024 =+++ rqxpxx
Ya hemos visto que si el último término de esta ecuación es negativo, necesariamente
tendrá dos raíces reales, una positiva y una negativa; pero si el último término es
positivo, no podemos inferir nada acerca del carácter de sus raíces. Si damos a esta
ecuación la siguiente forma
( ) ( ) ( ) ,022222 =−+++− axcaxbax
una forma que, desarrollada, se convierte en
( ) ( ) ( ) ,022 24224 =+++−+−++ cbaaxcbaxacbx
y si de esto, por comparación, surgen las siguientes ecuaciones de condición
,2 2 pacb =−+ ( ) ,2 qcba =− ( ) ,24 rcbaa =++
y de éstas, de nuevo, lo siguiente,
,2 2apcb +=+ ,2a
qcb =− ,3 24 rpaa =+
obtendremos, al resolver la última ecuación, que
.3636
22 prp
a ++−=
Si r se supone positiva, 2a será positiva y real, y, por lo tanto, a será real;
consecuentemente, también b y c serán reales.
Habiendo determinado de esta forma las cantidades a, b, y c, obtenemos la
ecuación transformada
( ) ( ) ( ) .02222 =−+++− axcaxbax
Poniendo la parte derecha de esta ecuación igual a y, y considerando a la curva
teniendo como abscisas a los diferentes valores de y, es obvio que, cuando b y c son
cantidades positivas, la curva yacerá - en su totalidad - arriba del eje, y, por lo tanto, la
ecuación no tendrá raíz real. En segundo lugar, si suponemos que b es una cantidad
negativa y c una positiva, entonces ax = dará ,4 2bay = una cantidad negativa. Una x
muy grande - positiva o negativa - dará entonces una y muy grande y positiva; y de esto
es fácil concluir que la ecuación tendrá dos raíces reales, una mayor que a y una menor
que a. De igual forma, encontraremos que si b es positiva y c negativa, la ecuación
tendrá dos raíces reales, una mayor y una menor que .a− Finalmente, si b y c son
ambas negativas, entonces y será negativa al hacer que
88
ax = y ax −= ,
y será positiva y muy grande para un valor de x muy grande (positivo o negativo); de
donde se sigue que la ecuación tendrá dos raíces reales, una mayor que a y una menor
que .a− Las consideraciones precedentes pueden ser extendidas, pero por ahora
debemos renunciar a su búsqueda.
Se verá del ejemplo precedente que la consideración de la curva no requiere que
la ecuación esté libre de expresiones fraccionarias. Lo mismo puede decirse de las
expresiones radicales. Incluso existe una ventaja en retener estas expresiones en la
forma dada por el análisis del problema; y es que podemos, de esta manera, limitar
nuestra atención a aquellos signos de los radicales que respondan a las exigencias
especiales de cada problema, en lugar de hacer que las fracciones y los radicales
desaparezcan, y así obtener una ecuación acomodada de acuerdo a las distintas
potencias enteras de la cantidad desconocida, y en donde frecuentemente son
introducidas raíces que son completamente ajenas a la cuestión propuesta. Es verdad
que estas raíces son siempre parte de la cuestión si ésta es vista en toda su extensión;
pero esta riqueza del análisis algebraico, aunque por sí misma y desde un punto de vista
general es extremadamente valiosa, puede resultar inconveniente y gravosa en casos
particulares en donde la solución que necesitamos no puede ser encontrada por métodos
directos, esto es, de manera independiente de cualesquiera otras soluciones posibles.
Cuando la ecuación que inmediatamente fluye de las consideraciones del problema
contiene radicales esencialmente ambiguos en cuanto a signo se refiere, la curva de esa
ecuación (construida al hacer que el lado igual a cero sea igual a la ordenada y)
necesariamente tendrá tantas ramas como haya posibles combinaciones diferentes de
estos signos; y para su solución completa, será necesario considerar cada una de estas
ramas. Pero esta generalidad puede ser restringida por las condiciones particulares del
problema que determinan la rama en la cual se busca la solución; el resultado de esto es
que nos evitamos muchos cálculos innecesarios - una ventaja que, por cierto, no es la
menos importante de las que nos ofrece el método de resolver ecuaciones a partir de la
consideración de curvas -.
Pero este método puede ser todavía más generalizado, e incluso hacerse
independiente de la ecuación del problema. Es suficiente con considerar - al aplicarlo -
las condiciones del problema por sí mismas, con dar a la cantidad desconocida valores
arbitrarios distintos, y con determinar - a partir de cálculos o construcciones - los errores
que resultan de tales suposiciones de acuerdo con las condiciones originales. Tomando
89
estos errores como las ordenadas y de una curva que tiene por abscisas los valores
correspondientes de la cantidad desconocida, obtenemos una curva continua llamada
curva de errores, que, debido a sus intersecciones con el eje, también proporciona todas
las soluciones del problema. Así, si se encuentran dos errores sucesivos, uno de los
cuales es un exceso, y el otro un defecto, esto es, uno positivo y otro negativo, podemos
concluir, enseguida, que entre estos dos valores correspondientes de la cantidad
desconocida habrá uno cuyo error será cero, y al cual nos podemos acercar tanto como
queramos por sustituciones sucesivas, o por la descripción mecánica de la curva.
Este modo de resolver cuestiones a partir de curvas de errores es uno de los más
útiles que se han creado. Se emplea constantemente en la astronomía cuando las
soluciones directas son difíciles o imposibles. También puede ser empleado para
resolver problemas importantes de la geometría y la mecánica, e incluso de la física. Es,
propiamente hablando, la regula falsi, tomada en su sentido más general, y hecha
aplicable a todas las cuestiones donde existe una cantidad desconocida a ser
determinada. También puede ser aplicado a problemas que dependan de dos o más
cantidades desconocidas, a partir de dar sucesivamente a estas cantidades desconocidas
distintos valores arbitrarios y calcular los errores que resultan de los mismos, y,
después, enlazarlos unos con otros por curvas diferentes, o reducirlos a tablas; siendo el
resultado de todo esto que podamos obtener directamente la solución buscada sin tener
que eliminar previamente las cantidades desconocidas. Ilustraremos esto a partir de unos
ejemplos.
Fig. 3
90
Se requiere un círculo en donde pueda ser inscrito un polígono de lados dados.
Este problema produce una ecuación que es proporcional en grado al número de
lados del polígono. Para resolverlo por el método recién expuesto, describimos
cualquier círculo ABCD (Fig. 3) y trazamos en este círculo los lados dados AB, BC,
CD, DE, EF del polígono que, por razones de simplicidad, supongo que es pentagonal.
Si el extremo del último lado cae sobre A, el problema está resuelto. Pero como es muy
improbable que esto suceda en un primer intento, trazamos, sobre la línea recta PR (Fig.
4), el radio PA del círculo, y erigimos sobre él - en el punto A - la perpendicular AF
igual a la cuerda AF del arco AF que representa el error en la suposición hecha con
respecto a la longitud del radio PA.
Fig. 4
Como este error es un exceso, será necesario describir un círculo que tenga un radio
mayor y hacer la misma operación que hicimos antes, y así varias veces, con círculos de
varios tamaños. Así, el círculo con el radio PA produce el error F’A’ que, como cae en
el lado más cercano del punto A’, debe ser considerado como negativo.
Consecuentemente, será necesario (Fig. 4) - al aplicar la ordenada A’F’ a la abscisa PA’
- trazar esa ordenada por debajo del eje. De esta manera, obtendremos distintos puntos
F, F’,…, que yacen en una curva cuya intersección R con el eje PA dará el verdadero
radio PR del círculo que satisface el problema, y encontraremos esta intersección al
91
causar sucesivamente que los puntos de la curva que están a ambos lados del eje (F,
F’…) se acerquen cada vez más unos con otros.
Desde un punto, cuya posición es desconocida, se observan tres objetos, cuyas
distancias unos de otros son conocidas. Los tres ángulos formados por los rayos de luz
desde estos tres objetos al ojo del observador son también conocidos. Se requiere la
posición del observador con respecto a los tres objetos.
Si los tres objetos son unidos por tres líneas rectas, es obvio que estas tres líneas
formarán - con los rayos visuales desde el ojo del observador - una pirámide triangular
cuya base y tres ángulos de la cara que forman el ángulo sólido en el vértice son dados.
Y como se supone que el observador está situado en el vértice, la cuestión se reduce a
determinar las dimensiones de esta pirámide.
Como la posición de un punto en el espacio está completamente determinada por
sus tres distancias desde tres puntos dados, es evidente que el problema se resolverá si
las distancias del punto en donde el observador está situado a cada uno de los tres
objetos pueden ser determinadas. Tomando estas tres distancias como las cantidades
desconocidas, tendremos tres ecuaciones de segundo grado que, después de la
eliminación correspondiente, producirán una ecuación resultante de octavo grado; pero
considerando sólo una de estas distancias y las relaciones de las otras dos con ella como
las cantidades desconocidas, la ecuación final será solamente de cuarto grado. De
acuerdo con esto, podemos, de manera rigurosa, resolver este problema a partir de los
métodos conocidos; pero la solución directa, que es complicada e inconveniente en la
práctica, puede ser reemplazada por la siguiente, que se alcanza por la curva de errores.
Fig. 5
92
Constrúyanse los tres ángulos sucesivos APB, BPC, CPD (Fig. 5), teniendo al
vértice P y respectivamente igual a los ángulos observados entre el primer objeto y el
segundo, el segundo y el tercero, el tercero y el primero; y tómese la línea PA al azar
para representar la distancia del observador al primer objeto. Como se supone que la
distancia de ese objeto al segundo es conocida, denótese por AB, y trácese la línea AB.
De esta manera, debemos obtener la distancia BP del segundo objeto al observador. De
igual forma, sea trazada en BC - la distancia del segundo objeto al tercero - la línea BC,
y tendremos la distancia PC de ese objeto con el observador. Si, ahora, la distancia del
tercer objeto con el primero se traza en la línea CD, tendremos a PD como la distancia
del primer objeto con el observador. Consecuentemente, si la distancia que primero
asumimos es exacta, las dos líneas PA y PD necesariamente tendrán que coincidir. Por
lo tanto, trazando en la línea PA, prolongada si es necesario, el segmento PE = PD, si el
punto E no cae sobre el punto A, la diferencia será el error de la primera suposición PA.
Habiendo trazado la línea recta PR (Fig. 6), suspendemos sobre ella, desde el punto fijo
P, la abscisa PA, y aplicamos a ella, en ángulos rectos, la ordenada EA; tendremos al
punto E de la curva de errores ERS.
Fig. 6
Tomando otras distancias por PA, y haciendo la misma construcción, obtendremos otros
errores que similarmente pueden ser aplicados a la línea PR, y que nos darán otros
puntos en la misma curva.
De esta forma podemos trazar esta curva a lo largo de distintos puntos, y el
punto R, donde corta al eje PR, nos dará la distancia PR, cuyo error es cero, y que
93
consecuentemente representará la distancia exacta del observador con respecto al primer
objeto. Siendo conocida esta distancia, las demás pueden ser obtenidas a partir de la
misma construcción.
Debe remarcarse que la construcción que hemos estado considerando da para
cada punto A de la línea PA, dos puntos B y B’ de la línea PB; y esto es porque, como
la distancia AB está dada, para encontrar el punto B sólo es necesario describir - del
punto A como centro y con radio AB - un arco de un círculo que corte la línea recta PB
en los dos puntos B y B’, y ambos puntos satisfacen las condiciones del problema. De la
misma manera, cada uno de estos últimos puntos mencionados dará dos más en la línea
recta PC, y cada uno de los últimos dará dos más en la línea recta PD. De esto se sigue
que cada punto A tomado sobre la línea recta PA dará, en general, ocho puntos sobre la
línea recta PD, todos de los cuales deben estar separados y considerados sucesivamente
para obtener todas las soluciones posibles. He dicho en general, porque es posible
(1) que los dos puntos B y B’ coincidan en un único punto, lo que sucederá cuando el
círculo descrito con el centro A y el radio AB toque la línea recta PB; y (2) que el
círculo no corte la línea recta PB en absoluto, en cuyo caso el resto de la construcción es
imposible, y lo mismo debe decirse respecto a los puntos C, D. De acuerdo con esto, es
necesario trazar la línea GF paralela a BP y a una distancia a ella igual a la línea dada
AB; el punto F - en el que esta línea corta la línea PE, prolongada si es necesario - será
el límite más allá del cual no deben considerarse los puntos A si queremos obtener
soluciones posibles. También existen límites para los puntos B y C, y pueden ser
empleados para restringir las primeras suposiciones hechas con respecto a la distancia
PA.
Los ocho puntos D, que dependen, en general, de cada punto A, responden a las
ocho soluciones de las cuales el problema es susceptible, y cuando uno no tiene datos
especiales por medio de los cuales pueda determinar cuál de estas soluciones responde
mejor al caso propuesto, es indispensable comprobar todas ellas empleando, para cada
una de las ocho combinaciones, una curva especial de errores. Pero si se sabe, por
ejemplo, que la distancia del observador al segundo objeto es mayor o menor que su
distancia al primero, será necesario tomar, en la línea PB, únicamente el punto B en el
primer caso y el punto B’ en el segundo. Este camino reducirá las ocho combinaciones a
la mitad. Si tenemos los mismos datos respecto al tercero objeto en relación con el
segundo, y con respecto al primer objeto relacionado con el tercero, entonces los puntos
C y D podrán ser determinados, y tendremos una única solución.
94
Estos dos ejemplos pueden ser suficientes para ilustrar los usos que este método
de curvas tiene para solucionar problemas. Pero este método, que hemos presentado, por
decirlo de alguna manera, de una manera mecánica, también puede ser presentado en
forma de análisis.
En realidad, toda la cuestión es reducible a la descripción de una curva que debe
pasar a través de un determinado número de puntos, ya sea que estos puntos estén dados
por cálculos o por construcción, o por observación o por simples experiencias
completamente independientes unas de las otras. El problema es, en verdad,
indeterminado, porque, estrictamente hablando, puede construirse un número infinito de
distintas curvas que pasen a través de un número dado de puntos, ya sean aquellas
regulares o irregulares, esto es, sujetas a ecuaciones o trazadas arbitrariamente con la
mano. Pero la cuestión no es encontrar cualesquiera soluciones, sino las más simples en
la práctica.
Así, si hay solamente dos puntos dados, la solución más simple es trazar una
línea recta entre los dos puntos. Si hay tres puntos dados, se debe trazar el arco de un
círculo a través de estos puntos, porque el arco de un círculo, después de la línea recta,
es la línea más simple que puede ser descrita.
Pero si el círculo es la curva más simple con respecto a la descripción, no lo es
con respecto a la ecuación entre sus abscisas y las ordenadas rectangulares. Bajo este
último punto de vista, aquellas curvas pueden ser consideradas como las más simples, y
sus ordenadas son expresadas por una función integral racional de las abscisas, como en
la siguiente ecuación
...,32 ++++= dxcxbxay
donde y es la ordenada y x la abscisa. Las curvas de esta clase son llamadas, en general,
parabólicas, porque pueden ser consideradas como una generalización de la parábola
(una curva representada por la ecuación precedente cuando ésta tiene sólo los primeros
tres términos). Ya hemos ilustrado su empleo al resolver ecuaciones, y su consideración
es siempre útil en la descripción aproximativa de las curvas, por la razón de que una
curva de este tipo siempre puede ser construida para pasar a través de tantos puntos de
una curva dada como queramos, siendo necesario únicamente tomar o considerar tantos
coeficientes indeterminados a, b, c,… como haya puntos dados, y determinar estos
coeficientes para obtener las abscisas y ordenadas para estos puntos. Ahora bien, es
evidente que cualquiera sea la curva propuesta, la curva parabólica así descrita siempre
95
diferirá de aquella cada vez menos si el número de los diferentes puntos es cada vez
mayor, y si la distancia de una a otra es cada vez menor.
NEWTON fue el primero en proponer este problema. Lo que sigue es la
solución que dio de él:
Sean P, Q, R, S,…los valores de las ordenadas y correspondientes a los valores
p, q, r, s,… de las abscisas x; tendremos las siguientes ecuaciones
...............................................
...,
...,
...,
32
32
32
++++=
++++=
++++=
drcrbraR
dqcqbqaQ
dpcpbpaP
El número de estas ecuaciones debe ser igual al número de coeficientes indeterminados
a, b, c,…. Sustrayendo estas ecuaciones una de la otra, los restos serán divisibles por
,pq − ,...,qr − y tendremos, después de tal división,
...,)()(
...,)()(
22
22
++++++=−−
++++++=−−
qrqrdqrcbqr
QR
pqpqdpqcbpq
PQ
Sean
,1Qpq
PQ =−−
,1Rqr
QR =−−
,...1Srs
RS =−−
Debemos encontrar, de igual manera (por resta y división), lo siguiente:
........................................................
...,)(
...,)(
11
11
++++=−−
++++=−−
qrsdcqs
RS
pqrdcpr
QR
Además, sean
,211 R
pr
QR =−−
,...211 S
qs
RS =−−
Tendremos que
...,22 +=−−
dps
RS
y así sucesivamente.
De esta manera, encontraremos el valor de los coeficientes a, b, c,…comenzando
con el último y, sustituyéndolos en la ecuación general
96
...,32 ++++= dxcxbxay
obtendremos, después de haber hecho las reducciones apropiadas, la fórmula
...))()(())(()( 321 +−−−+−−+−+= rxqxpxSqxpxRpxQPy ,}… (1)
que puede ser llevada hasta donde queramos.
Pero esta solución puede ser simplificada a partir de la siguiente consideración.
Debido a que y necesariamente se vuelve P, Q, R…, cuando x se vuelve p, q, r,
es fácil ver que la expresión para y será de la forma
....++++= DSCRBQAPy } (2)
donde las cantidades A, B, C,… están expresadas de tal manera en términos de x, que, al
hacer que px = , tendremos
,1=A ,0=B ,...,0=C
y al hacer que ,qx = tendremos
,0=A ,1=B ,0=C ,...,0=D
y al hacer que ,rx = similarmente tendremos
,0=A ,0=B ,1=C ,...,0=D etc.
De donde es fácil concluir que los valores de A, B, C,… deben ser de la forma
,)...)()((
)...)()((
,)...)()((
)...)()((
,)...)()((
)...)()((
srqrpr
sxqxpxC
sqrqpq
sxrxpxB
sprpqp
sxrxqxA
−−−−−−=
−−−−−−=
−−−−−−=
donde hay tantos factores en los numeradores y en los denominadores como hay puntos
dados de la curva menos uno.
La última expresión para y (véase la ecuación 2), aunque distinta en forma, es la
misma que la ecuación 1. Para mostrar esto, basta decir que los valores de las cantidades
Q1, R2, S3,… simplemente necesitan ser desarrollados y sustituidos en la ecuación 1, y
los términos acomodados con respecto a las cantidades P, Q, R,…. Pero la última
expresión para y (ecuación 2) es preferible, en parte debido a la simplicidad del análisis
de donde deriva, y en parte debido a su forma, que resulta más conveniente para la
computación.
Ahora, por medio de esta fórmula, que no es difícil reducir a una construcción
geométrica, podemos encontrar el valor de la ordenada y para cualquier abscisa x,
97
porque las ordenadas P, Q, R… para las abscisas dadas p, q, r,… son conocidas. Así, si
tenemos varios términos de cualquier serie, podemos encontrar cualquier término
intermedio que queramos; un expediente, por cierto, que es extremadamente valioso
para suplir lagunas que puedan surgir en una serie de observaciones o experimentos, o
en tablas calculadas por fórmulas o en construcciones dadas.
Si ahora esta teoría es aplicada a los dos ejemplos discutidos arriba, y a ejemplos
similares en donde tengamos errores correspondientes a diferentes suposiciones,
podemos encontrar directamente el error y que corresponde a cualquier suposición
intermedia x al considerar a las cantidades P, Q, R,…, como los errores encontrados, y a
p, q, r,…, como las suposiciones de donde éstos resultan. Pero como en estos ejemplos
la cuestión no es encontrar el error que corresponde a una suposición dada, sino la
suposición cuyo error sea cero, es evidente que la cuestión presente es la opuesta de la
precedente, y que también puede ser resuelta por la misma fórmula al tomar
recíprocamente las cantidades p, q, r,… para los errores, y las cantidades P, Q, R,…
para las suposiciones correspondientes. Entonces, x será el error para la suposición y; y,
consecuentemente, al hacer que ,0=x el valor de y será el de la suposición cuyo error
es cero.
Sean P, Q, R,… los valores de la cantidad desconocida en las diferentes
suposiciones, y p, q, r… los errores resultantes de estas suposiciones, a los que se les
dan los signos apropiados. Tendremos entonces, para el valor de la cantidad
desconocida cuyo error es cero, la expresión
...,+++ CRBQAP
en la que los valores de A, B, C,… son
...,
...,
...,
×−
×−
=
×−
×−
=
×−
×−
=
rq
q
rp
pC
qr
r
qp
pB
pr
r
pq
qA
en donde son considerados tantos factores como haya suposiciones menos uno.