Kolik je 2-3 aneb konstrukce celých čísel

Co si přečíst před tímto článkem – článek o počítání v \(\mathbb{N}\).

Některé rovnice nemají v \(\mathbb{N}\) řešení

Už jsme se naučili spočítat, kolik je \(2+2\). Vlastně jsme si vymysleli nekonečně mnoho různých symbolů, kterými jsme doposud byli zvyklí počítat věci.

Tato konstrukce nám však umožňuje další věci, a to vyřešit nekonečně mnoho různých rovnic. Např. rovnici
$$ 3+x = 5 $$
řeší \(x = succ(succ(succ(0))) \), což jsme zkráceně psali symbolem \(3\).

Nebo tuto rovnici
$$ 102+x = 350 $$
řeší (a tentokrát řešení napíši již zkráceným zápisem) \(x = 248\).

Snadno si řešení obou dvou rovnic ověříme tím, že dosadíme za \(x\) domnělý výsledek a spočteme podle definice sčítání.

Tyto rovnice si můžeme zkusit aplikovat na něco konkrétního – např. se můžu ptát následovně:

Mám 3 koruny, kolik jich ještě potřebuji mít, abych jich měl 5?

Nebo v druhém případě:

Mám 102 korun, kolik jich ještě potřebuji mít, abych jich měl 350?

Co kdybych se ptal ale trochu naopak:

Mám 200 korun, kolik jich ještě potřebuji nemít, abych jich měl 100?

K této otázce vymyslíme následující rovnici:
$$ 200 + x = 100. $$

Ať se budeme sebevíc snažit, v množině \(\mathbb{N}\), kterou jsme zkonstruovali v minulém článku, nenajdeme žádný prvek, pro který by byla daná rovnice splněna.

Předpokládejme pro spor, že tuto rovnici řeší nějaké \(n \in \mathbb{N}\). Potom \(200+n \geq 200 > 100\), a tedy (kvůli trichotomii, V9) nemůže platit, že \(200+n = 100\).

Musíme tedy zkonstruovat nový typ čísel, které budou obsahovat prvky, které podobné rovnice vyřeší – a uděláme to tak, že využijeme jen přirozených čísel a operací na nich definovaných.

Dvojice přirozených čísel

Představme si následující rovnice, které nás jistě můžou napadnout už v \(\mathbb{N}\):
$$ 3+x  = 2 $$
nebo
$$ 4+x = 3, $$
$$ 5+x = 4, $$
$$ 6+x = 5, $$
$$ 7+x = 6 $$

atd.

Zjevně každou rovnici řeší stejné číslo, máme tedy nekonečně mnoho reprezentací jednoho čísla – zkusme si definovat celá přes nějaké dvojice přirozených čísel.

Prvek, který je řešením všech našich rovnic, je zjevně spjat např. s čísly \(2\) a \(3\) – ale také např. s čísly \(5\) a \(6\). Vidíme tedy, že tyto dvě dvojice jsou v určitém smyslu ekvivalentní. Potřebujeme ale tuto ekvivalenci nějak definovat pro všechny různé dvojice \( (a,b) \) a \( (c,d) \), musíme obecně říct, kdy jsou dvě dvojice ekvivalentní.

Všimněme si, že pro mé dvojice \( (2,3)\) a \( (5,6)\) platí, že
$$ 2+6 = 3+5. $$

Řekneme tedy, že libovolné dvě dvojice přirozených čísel \(a,b\) a \(c,d\) jsou si ekvivalentní právě tehdy, když \(a+d = b+c\).

Symbolicky zapsáno:
$$ (a,b) \sim (c,d) \Leftrightarrow a+d = b+c. $$

Nyní, již s nějakou intuicí, můžeme relativně krátce napsat, co budeme chápat jako celá čísla.

Konstrukce celých čísel

Mějme množinu \(\mathbb{N} \times \mathbb{N} \), čili máme uspořádané dvojice přirozených čísel. Na ní definujme relaci ekvivalence následovně:
$$  (a,b) \sim (c,d) \Leftrightarrow a+d = b+c. $$

Prvky této množiny, kterou budeme značit \(\mathbb{Z}\), budeme nazývat celými čísly.
Do této množiny patří např. prvky \( (2,1)\), \( (0,4)\), \( (72,50)\), \( (3,7)\),…

Které z prvků, které jsem napsal, se sobě rovnají? \( (0,4)\) a \( (3,7)\), neboť platí, že \(0+7 = 4+3\). Můžeme dokonce najít nekonečně mnoho dvojic, které se rovnají. Mějme např. následující dvojice \( (3,0), (4,1), (5,2), (6,3),…\) O nich můžeme říci, že patří do stejné třídy ekvivalence. Zapisujeme to následujícím způsobem:

$$ [(3,0)] = \left \{(3,0), (4,1), (5,2), (6,3), … \right \} $$

Zjevně platí, že \( [(3,0)] = [(4,1)] = …\)

Měli bychom ukázat, že to, co prohlašujeme za ekvivalenci, je opravdu ekvivalencí.

Ekvivalence

Ekvivalence je relací, která je reflexivní, symetrická a tranzitivní.

Reflexivita:
$$ \forall (a,a) \in \mathbb {Z}: (a,a) \sim (a,a). $$

Přepišme si podle definice naší relace: \(a+a = a+a\), což podle V8 můžeme přepsat na \(a = a\), což je zjevně pravda.

Symetrie:
$$ \forall (a,b), (c,d) \in \mathbb {Z}: (a,b) \sim (c,d) \Rightarrow (c,d) \sim (a,b) .$$

Přepišme si tyto relace podle jejich definic, tedy dostáváme, že

$$ a+d = b+c \Rightarrow c+b = d+a. $$

Máme zde nějaké rovnosti přirozených čísel a tam již víme, že platí-li, že \(a = b\), pak i \(b = a\), tedy můžeme naší implikaci přepsat následovně

$$ a+d = b+c \Rightarrow d+a = c+b. $$

Stejně tak už podle V3 víme, že v přirozených číslech je sčítání komutativní, dostáváme tedy, že

$$ a+d = b+c \Rightarrow a+d = b+c, $$

což zjevně platí, čili naše relace je i symetrická.

Tranzitivita:
$$ \forall (a,b), (c,d), (e,f): ( (a,b) \sim (c,d) ) \land ( (c,d) \sim (e,f) ) \Rightarrow (a,b) \sim (e,f). $$

Přepišme si opět všechny relace podle naší definice a podívejme se, jestli daná implikace platí.

Na levé straně implikace máme po přepsaní

$$ a+d = b+c \land c+f = d+e. $$

K oběma stranám první rovnice můžeme podle V8.2 přičíst \(e\) a dostáváme, že
$$ a+d+e = b+c+e. $$

Za \(d+e\) můžeme dosadit z druhé rovnice a dostáváme, že
$$ a+c+f = b+c+e, $$
což můžeme podle V3 přepsat takto:
$$ a+f+c = b+e+c $$
a nyní podle V8 můžeme poslední rovnost přepsat takto:
$$ a+f = b+e, $$
což ale není nic jiného než tvrdit, že \( (a,b) \sim (e,f) \), což jsme chtěli dokázat.

Sčítání celých čísel

Nyní si můžeme definovat, stejně jako u přirozených čísel, nějaké operace. Začneme sčítáním a součet dvou celých čísel, definujeme následovně:
$$ [(a,b)]+[(c,d)] = [(a+c, b+d)]. $$

Zde se někdy vlevo místo symbolu \(+\) píše jiný symbol (např. \(\bigoplus\) ), takže bychom psali, že \([(a,b)] \bigoplus [(c,d)] = [(a+c, b+d)]\). Je to z toho důvodu, že v principu je sčítání na přirozených číslech jiná operace než sčítání na celých číslech. V tomto textu budeme v obou případech používat symbol \(+\) a budeme doufat, že je z kontextu zřejmé, jaká čísla sčítáme.

Např. \( (3,2) + (7,1) = (3+7,2+1) = (10,3) \).  Ale POZOR! Místo \( (3,2)\) bychom klidně mohli napsat  \( (30,20) \) a místo  \( (7,1)\) bychom mohli napsat \( (35,5)\), protože jsou ve stejné třídě ekvivalence a nemáme zatím nikde obecně dokázáno, že mi vyjde prvek, který bude ve stejné třídě ekvivalence jako prvek \( (a+c,b+d)\).

Sčítání celých čísel je dobře definovaná operace

Pojďme si ukázat, že obecně platí, že nám doopravdy vyjde prvek ve stejné třídě ekvivalence jako \( (a+c, b+d)\), i když vybereme jiné prvky než \( (a,b), (c,d)\), ale ze stejných tříd ekvivalencí jako \( (a,b),(c,d)\).

Jinými slovy máme dokázat tuto implikaci:
$$ (a,b) \sim (a‘,b‘) \land (c,d) \sim (c‘, d‘) \Rightarrow (a+c,b+d) \sim (a’+c‘, b’+d‘). $$

Přepišme si podle definice naší ekvivalence relace na levé straně:

$$ a+b‘ = b+a‘,$$
$$c+d’=d+c‘.$$

K oběma stranám první rovnice podle V8.2 přičteme \(c+d’\) a dostáváme, že:
$$ a+b‘ +c+d‘ = b+a’+c+d‘.$$

My ale podle V3 víme, že \(c+d‘ = d+c’\), dosaďme to tedy do pravé strany naší rovnosti:
$$ a+b’+c+d = b+a’+d+c‘.$$
Nyní podle V2 a V3:
$$ a+c+b’+d‘ = b+d+a’+c‘,$$
což když přepíšeme podle definice naší ekvivalence, dostáváme:
$$(a+c,b+d) \sim (a’+c‘, b’+d‘). $$

Tedy vidíme, že naše operace sčítání je dobře definovaná a nezáleží na tom, jaký prvek si vybereme, zůstaneme-li ve stejné třídě ekvivalence.

Operace násobení

Dále si definujme na celých číslech operaci násobení, a to následujícím způsobem:
$$ (a,b)*(c,d) = (ac+bd, ad+bc). $$
Všimněme si, že vzhledem k V3 můžeme také psát, že:
$$ (a,b)*(c,d) = (bd+ac, bc+ad). $$
Opět si pojďme ověřit, že je naše operace dobře definovaná, jinými slovy, že:
$$ (a,b) \sim (c,d) \land (e,f) \sim (g,h) \Rightarrow (a,b)*(e,f) \sim (c,d)*(g,h) $$
neboli:
$$ (a,b) \sim (c,d) \land (e,f) \sim (g,h) \Rightarrow (a*e+b*f, a*f+b*e) \sim (c*g+d*h,c*h+d*g). $$

Abychom nenapsali jen suchý výčet operací, které provedeme, zkusíme nějak komentovat každý krok. Máme k dispozici jen vztahy na levé straně implikace a nějakou jejich kombinací musíme dojít ke vztahu na pravé straně. Přepišme si naše ekvivalence podle jejich definice:

\( a+d = b+c \land e+h = f+g \Rightarrow ae+bf+ch+dg = af+be+cg+dh. \)

Začneme od rovnosti \(a+d = b+c\). Víme, že bychom si přáli, aby nám na konci vyšlo, že vlevo budeme mít prvek \(ae\) a vpravo prvek \(be\). Vynásobme tedy obě dvě strany této rovnice číslem \(e\). Dostáváme:

\( e(a+d) = e(b+c).\)

Dále budeme pokračovat v podobném duchu, vždy přičteme k oběma stranám rovnice něco ve tvaru \(x(y+z)\). Vidíme, že vlevo bychom si moc přáli mít prvek \(fb\), ale chtěli bychom přičítat něco ve tvaru \(f(b+?)\). Vidíme, že vzhledem k rovnicím, kterými jsme začli, hodilo by se přičíst k oběma stranám rovnice \(f(b+c)\), udělejme to tedy:

\( e(a+d)+f(b+c) = e(b+c)+f(b+c). \)

Napravo bychom ale moc chtěli mít prvek \(fa\), nikoliv \(fb\). To půjde snadno zařídit, neboť víme, že \(b+c = a+d\), dosaďme to tedy na pravou stranu:

\( e(a+d)+f(b+c) = e(b+c)+f(a+d).\)

Dále bychom na pravé straně moc chtěli prvek \(ch\), zkusme tedy přičíst \(h(c+?)\). Co by mělo být místo otazníku? Opět v prvních dvou rovnicích máme \(b+c\) (což je podle V3 komutativitě to samé, co \(c+b\)), čili by nám mohlo připadat logické přičíst k oběma stranám \(h(c+b)\). ALE POZOR!

Kdybychom to udělali, měli bychom na levé straně dvakrát v závorce \(a+b\). Abychom se tomu vyhli, přičtěme k oběma stranám spíše \(c(e+h) \)

\( e(a+d)+f(b+c) +c(e+h) = e(b+c)+f(a+d)+c(e+h).\)

Na pravé straně bychom však spíše chtěli prvek \(cg\), přepišme tedy \(e+h\) na \(f+g\):

\( e(a+d)+f(b+c) +c(e+h) = e(b+c)+f(a+d)+c(f+g).\)

A nakonec bychom chtěli na levé straně mít prvek \(dg\). Nabízí se možnost přičíst k oběma stranám rovnice \(g(a+d)\), ale to bychom na levé straně měli dvakrát závorku s \(a+d)\), přičtěme tedy radši \(d(f+g)\):

\( e(a+d)+f(b+c) +c(e+h) +d(f+g) = e(b+c)+f(a+d)+c(f+g)+d(f+g).\)

Ale na pravé straně bychom chtěli spíš mít prvek \(dh\), přepišme tedy \(f+g\):

\( e(a+d)+f(b+c) +c(e+h) +d(f+g) = e(b+c)+f(a+d)+c(f+g)+d(e+h).\)

Nyní vše podle V4 roznásobme:

\( ae+de+bf+cf+ce+ch+df+dg = eb+ec+af+df+cf+cg+de+dh \)

a přeházejme podle V3 pořadí:

\( ae+bf+ch+dg+de+cf+ce+df = af+be+cg+dh+de+cf+ce+df \)

a díky V2 můžeme udělat toto:

\( (ae+bf+ch+dg)+(de+cf+ce+df) = (af+be+cg+dh)+(de+cf+ce+df)\)

a z V8 plyne, že:

\( ae+bf+ch+dg = af+be+cg+dh, \)

což je to, co jsme chtěli dokázat!

Můžeme to ještě přepsat do tvaru

\( (ae+bf)+(ch+dg) = (af+be)+(cg+dh),\)

což podle definice naší relace ekvivalence můžeme přepsat na

\( (ae+bf, af+be) \sim (cg+dh,ch+dg), \)

což ale podle definice násobení celých čísel není nic jiného než

\( (a,b)*(e,f) \sim (c,d)*(g,h), \)

čili teď už můžeme bez výčitek svědomí psát, že naprosto obecně platí:

\( (a,b) \sim (c,d) \land (e,f) \sim (g,h) \Rightarrow (a,b)*(e,f) \sim (c,d)*(g,h). \)

Jak to sakra souvisí s celými čísly?

Pojmenujme si postupně nějak naše třídy ekvivalence.
$$ 0 \equiv  (0,0) \sim (1,1) \sim (2,2) \sim … \sim (k,k), $$
$$ -1 \equiv (0,1) \sim (1,2) \sim (2,3) \sim … \sim (k,k+1), $$
$$ 1  \equiv (1,0) \sim (2,1) \sim (3,2) \sim … \sim (k+1,k), $$

etc.

Jako \( (a,b)\) chápeme
$$a-b$$
a symbol \(-\) značí to, co se běžně pojmenovává jako operace minus. Potom např. \( (5,0) = 5-0 = 5 \) nebo \( (2,3) = 2-3 = -1 \) atd.

Zde opět vidíme, proč \(a,b\) patří do nějaké třídy ekvivalence – neboli proč patří do nějaké množiny, kde jsou všechny prvky ekvivalentní. Zřejmě např.
$$ 0-1 = 1-2 = 2-3 = 3-4 = … $$

Obecně platí, že \( (a,b) \sim \ (a+c,b+c) \), neboť \(a+(b+c)\) se díky V2 a V3 rovná \(b+(a+c)\).

\(\mathbb{N} \subset \mathbb{Z}\)

Množina přirozených čísel je podmnožinou celých čísel (a zjevně \(\mathbb{N} \neq \mathbb{Z}\), např. prvek \(-5\) patří do \(\mathbb{Z}\), ale ne do \(\mathbb{N}\) ). Každému přirozenému číslu \(n\) totiž můžeme přiradit třídu ekvivalence \([(n,0)]\).

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *