Dimostrazioni

Sottostrutture ottime

Rodcut

Il problema del rodcut gode della proprietà della sottostruttura ottima di seguito la dimostrazione:

Prendiamo una soluzione ottima $S^{*}$ del problema
Supponiamo che questa soluzione preveda il taglio dell’asta in due pezzi: uno di lunghezza $k$ e uno di lunghezza $n - k$ , il valore di questa soluzione quindi è definito come $p (S^{*}) = p (S_{k}) + p (S_{n - k})$
Supponendo per assurdo che $S_{n - k}$ non sia ottima, abbiamo quindi un’altra decomposizione $S_{n - k}^{'}$ con valore più alto
Quindi otteniamo una nuova soluzione ottima definita in questo modo: $p (S_{mi g l i ore}^{*}) = p (S_{k}) + p (S_{n - k}^{'})$
Visto che $p (S_{n - k}^{'}) > p (S_{n - k})$ allora $p (S_{mi g l i ore}^{*}) > p (S^{*})$ , questo rappresenta una contraddizione in quanto $S$ era già ottima

Matrix

Presa la sequenza di matrici $A_{1}, A_{2}, \dots, A_{n}$ supponiamo che una parentesizzazione migliore di questa sequenza suddivida in questo modo il prodotto: $(A_{1} \dots A_{k}) \times (A_{k} \dots A_{n})$ ovviamente anche entrambe le sottosequenze devono essere prarentesizzate in modo ottimo e quindi avremo che: $S_{1, n}^{*} = S_{1, k}^{*} + S_{k + 1, n}^{*} + P_{0} P_{k} P_{n}$ Di seguito la dimostrazione:

Supponiamo per assurdo che per la prima parte (da $1$ a $k$ ) esiste una soluzione migliore di quella usata $S_{1, k}^{mi g l i ore}$ tale che $S_{1, k}^{mi g l i ore} < S_{1, k}^{*}$
Quindi riusciamo a costruire una soluzione migliore nella forma: $S_{1, n}^{mi g l i ore} = S_{1, k}^{mi g l i ore} + S_{k + 1, n}^{*} + P_{0} P_{k} P_{n}$
Visto che $S_{1, k}^{mi g l i ore} < S_{1, k}^{*}$ allora sicuramente $S_{1, n}^{mi g l i ore} < S_{1, n}^{*}$ ma questa è una contraddizione in quanto la prima soluzione era già ottima

Longest common subsequence

Siano $X = ⟨ x_{1}, x_{2}, \dots, x_{m} ⟩$ e $Y = ⟨ y_{1}, y_{2}, \dots, y_{n} ⟩$ le sequenze; sia $Z = ⟨ z_{1}, z_{2}, \dots, z_{k} ⟩$ una qualsiasi LCS di $X$ e $Y$ .

Se $x_{m} = y_{n}$ , allora $z_{k} = x_{m} = y_{n}$ e $Z_{k - 1}$ è una LCS di $X_{m - 1}$ e $Y_{n - 1}$ .
Se $x_{m} \neq = y_{n}$ , allora $z_{k} \neq = x_{m}$ implica che $Z$ è una LCS di $X_{m - 1}$ e $Y$ .
Se $x_{m} \neq = y_{n}$ , allora $z_{k} \neq = y_{n}$ implica che $Z$ è una LCS di $X$ e $Y_{n - 1}$ . Di seguito la dimostrazione
Visto che deve essere $z_{k} = x_{m} = y_{n}$ . Ora, il prefisso $Z_{k - 1}$ è una sottosequenza comune di $X_{m - 1}$ e $Y_{n - 1}$ di lunghezza $k - 1$ . Vogliamo dimostrare che questo prefisso è una LCS. Supponiamo per assurdo che ci sia una sottosequenza comune $W$ di $X_{m - 1}$ e $Y_{n - 1}$ di lunghezza maggiore di $k - 1$ . Allora, accodando $x_{m} = y_{n}$ a $W$ si ottiene una sottosequenza comune di $X$ e $Y$ la cui lunghezza è maggiore di $k$ , che è una contraddizione.
Se $z_{k} \neq = x_{m}$ , allora $Z$ è una sottosequenza comune di $X_{m - 1}$ e $Y$ . Se esistesse una sottosequenza comune $W$ di $X_{m - 1}$ e $Y$ di lunghezza maggiore di $k$ , allora $W$ sarebbe anche una sottosequenza comune di $X_{m}$ e $Y$ , contraddicendo l’ipotesi che $Z$ sia una LCS di $X$ e $Y$ .
La dimostrazione è simmetrica a quella del punto (2).

Longest common substring

Se i caratteri $X [i]$ e $Y [j]$ sono uguali, allora la lunghezza del suffisso comune che termina in $(i, j)$ dipende direttamente dalla lunghezza del suffisso comune che terminava in $(i - 1, j - 1)$ . Di seguito la dimostrazione:

Supponiamo che $X [i] = Y [j]$ . Poiché stiamo cercando una sottostringa, il carattere corrente estende semplicemente ciò che c’era immediatamente prima. Se la soluzione per $(i, j)$ è una stringa di lunghezza $K > 1$ , significa che i caratteri $X [i]$ e $Y [j]$ sono l’ultimo carattere di questa stringa. Se rimuoviamo questo ultimo carattere, rimaniamo con una sottostringa comune di lunghezza $K - 1$ che termina agli indici $i - 1$ e $j - 1$ .

Affinché la soluzione a $(i, j)$ sia ottima (massima), anche la soluzione a $(i - 1, j - 1)$ deve essere ottima. Se ci fosse un suffisso comune più lungo a $(i - 1, j - 1)$ , potremmo aggiungerci $X [i]$ (che è uguale a $Y [j]$ ) ottenendo un risultato migliore per $(i, j)$ , contraddicendo l’ipotesi iniziale.

Distanza di editing

Tesi: Sia $S$ una sequenza ottima di operazioni che trasforma il prefisso $X [1 \dots i]$ nel prefisso $Y [1 \dots j]$ . Vogliamo dimostrare che la sottosequenza contenuta in $S$ che risolve i sottoproblemi deve essere a sua volta ottima.

Dimostrazione: analizziamo l’ultima operazione effettuata nella sequenza $S$ , da qui distinguiamo 3 casi possibili

L’utlima operazione è una sostituzione, allora $S$ è composta da una sottosequenza $S^{'}$ e da un operazione di sostituzione, allora il suo costo totale è $costo(S) = Costo(S’) + costo sostituzione$ Se $S^{'}$ per assurdo non è ottima allora esisterebbe $S^{''}$ con un costo strettamente minore, questo significa che abbiamo trovato una soluzione $W$ con un costo minore di $S$ , siamo arrivati ad una contraddizione
Analoga ma con la cancellazione come ultima operazione
Analoga ma con l’inserimento come ultima operazione

Huffman

Definizioni iniziali:

$Σ$ : Insieme dei caratteri (soluzione $T$ )
Consideriamo due nodi $a$ e $b$ (le foglie con frequenza minima) e il loro genitore $z$ .
$Σ^{'} = Σ - {a, b} \cup {z}$ (soluzione $T^{'}$ )

Relazioni tra frequenze e profondità:

$f (z) = f (a) + f (b)$
$d_{T} (a) = d_{T^{'}} (z) + 1$ e $d_{T} (b) = d_{T^{'}} (z) + 1$ **Costruzione di una relazione tra T e T’ $: * * I l cos t o d e l l^{'} a l b ero$ T $, d e n o t a t oco m e$ B(T)$, è dato dalla somma delle frequenze per le profondità: $B (T) = \sum_{c \in Σ} f (c) \cdot d_{T} (c)$
Espandendo la sommatoria per mettere in relazione $T$ con $T^{'}$ : $B (T) = [\sum_{c \in Σ^{'}} f (c) d_{T^{'}} (c)] - f (z) \cdot d_{T^{'}} (z) + f (a) d_{T} (a) + f (b) d_{T} (b)$ Nota: Il termine tra parentesi quadre è $B (T^{'})$ . Sottraiamo il contributo di $z$ (che è in $T^{'}$ ma non è foglia in $T$ ) e aggiungiamo i contributi di $a$ e $b$ .
Sostituendo le relazioni di profondità e frequenza ( $f (z) = f (a) + f (b)$ ): $B (T) = B (T^{'}) - (f (a) + f (b)) d_{T^{'}} (z) + f (a) (d_{T^{'}} (z) + 1) + f (b) (d_{T^{'}} (z) + 1)$
Svolgendo i calcoli, i termini con $d_{T^{'}} (z)$ si cancellano: $= f (a) + f (b)$
Quindi la relazione fondamentale è: $B (T) = B (T^{'}) + f (a) + f (b)$ Suppongo che la sottostruttura ottima non esista

Ipotesi per assurdo: Supponiamo che $T$ non sia l’albero ottimo per $Σ$ (e quindi anche che $T^{'}$ non sia l’albero ottimo per $Σ^{'}$ ). Di conseguenza, deve esistere un albero $T_{o pt}$ con costo strettamente inferiore a $T$ : $B (T_{o pt}) < B (T)$
Costruzione dell’albero ridotto: Prendiamo $T_{o pt}$ e uniamo le foglie $a$ e $b$ nel padre $z$ . Otteniamo un nuovo albero $T_{o pt}^{'}$ valido per l’alfabeto ridotto $Σ^{'}$ . Il costo di questo albero ridotto è: $B (T_{o pt}^{'}) = B (T_{o pt}) - (f (a) + f (b))$
Sviluppo algebrico: Riprendiamo la disuguaglianza del punto 1: $B (T_{o pt}) < B (T)$ Sottraiamo a entrambi i membri la quantità costante $(f (a) + f (b))$ : $B (T_{o pt}) - (f (a) + f (b)) < B (T) - (f (a) + f (b))$ Sostituiamo i termini con le definizioni dei costi ridotti ( $B (T_{o pt}^{'})$ e $B (T^{'})$ ): $B (T_{o pt}^{'}) B (T_{o pt}) - (f (a) + f (b)) < B (T^{'}) B (T) - (f (a) + f (b))$ Otteniamo infine: $B (T_{o pt}^{'}) < B (T^{'})$ Abbiamo dimostrato l’esistenza di un albero $T_{o pt}^{'}$ con costo inferiore a $T^{'}$ . Questo contraddice l’ipotesi iniziale che $T^{'}$ fosse l’albero ottimo per $Σ^{'}$ .

Activity selector

Tesi Per dimostrare la sottostruttura ottima, definiamo l’insieme $S_{ij}$ come l’insieme delle attività che iniziano dopo la fine di $a_{i}$ e finiscono prima dell’inizio di $a_{j}$ . Supponiamo che una soluzione ottima $A_{ij}$ contenga l’attività $a_{k}$ . Se questa attività fa parte della soluzione, essa divide il problema in due sottoproblemi:

Trovare le attività compatibili in $S_{ik}$ (quelle che stanno tra $a_{i}$ e $a_{k}$ ).
Trovare le attività compatibili in $S_{kj}$ (quelle che stanno tra $a_{k}$ e $a_{j}$ ). La soluzione totale sarà quindi: $A_{ij} = A_{ik} \cup {a_{k}} \cup A_{kj}$ . E la sua dimensione sarà: $∣ A_{ij} ∣ = ∣ A_{ik} ∣ + ∣ A_{kj} ∣ + 1$ .

Dimostrazione Per dimostrare che la soluzione è ottima, procediamo per assurdo. Supponiamo che la sottoparte $A_{kj}$ non sia ottima. Allora deve esistere un altro insieme $A_{kj}^{'}$ più grande (cioè con più attività). Se fosse così, potremmo “tagliare” $A_{kj}$ dalla nostra soluzione originale e “incollarci” $A_{kj}^{'}$ . In questo modo otterremmo una soluzione totale più grande di $A_{ij}$ . Ma questo è impossibile, perché avevamo ipotizzato che $A_{ij}$ fosse già la soluzione massima. Questa contraddizione ci conferma che una soluzione ottima deve per forza contenere le soluzioni ottime dei suoi sottoproblemi.

Cammini minimi

Teorema: Dati

un grafo orientato $G = (V, E)$
la funzione peso $w : E \to R$
sia $p = (v_{0}, v_{1}, \dots, v_{k})$ un cammino minimo dal vertice $v_{0}$ al $v_{k}$ per qualsiasi $i$ e $j$ tali che $0 \leq i \leq j \leq k$ sia $p_{ij}$ un sotto-cammino di $p$ dal vertice $v_{i}$ al vertice $v_{j}$ allora $P_{ij}$ è un cammino minimo da $v_{i}$ a $v_{j}$ Dimostrazione: Se scomponiamo il cammino $p$ in $ν_{0} ⇝ p_{0 i} ν_{i} ⇝ p_{ij} ν_{j} ⇝ p_{jk} ν_{k}$ abbiamo $w (p) = w (p_{0 i}) + w (p_{ij}) + w (p_{jk})$ . Supponiamo adesso che ci sia un cammino $p_{ij}^{'}$ da $v_{i}$ a $v_{j}$ con peso $w (p_{ij}^{'}) < w (p_{ij})$ . Allora $ν_{0} ⇝ p_{0 i} ν_{i} ⇝ p_{ij}^{'} ν_{j} ⇝ p_{jk} ν_{k}$ è un cammino da $v_{0}$ a $v_{k}$ il cui peso è minore di $w (p)$ che contraddice l’ipotesi che $p$ sia un cammino minimo da $v_{0}$ a $v_{k}$

Scelta greedy

Huffman

Teorema: possiamo scegliere i due nodi con frequenza più bassa ad ogni passaggio e questa scelta localmente ottima è anche una scelta globalmente ottima Dimostrazione:

Abbiamo $T$ che rappresenta una soluzione ottima, ma in cui la scelta greedy non è stat necessariamente rispettata, quindi $x$ e $y$ due nodi con la frequenza minima non sono fratelli e si trovano in una posizione qualsiasi
Prendiamo $a$ e $b$ due nodi fratelli alla massima profondità dell’albero, su questi nodi possiamo dire che:
1. $f (x) \leq f (a)$ e $f (x) \leq f (b)$
2. $d_{t} (a) \geq d_{t} (x)$ e $d_{t} (b) \geq d_{t} (y)$
Creaiamo un nuovo albero $T^{'}$ uguale a $T$ ma con $x$ e $a$ scambiati (stessa cosa per $y$ e $b$ ). Ricordando che il costo di $T$ è deifnito come $\sum f (c) * d_{t} (c)$ di seguito vediamo quanto ci è costato passare da $T$ a $T^{'}$ : B(T)-B(T') = f(x)d_T(x)+f(a)d_T(a)-[f(x)d_T(a)+f(a)d_T(x)]$$$$B(T)-B(T') = f(x)(d_T(x)-d_T(a))+f(a)(d_T(a)-d_T(x))$$$$B(T)-B(T') = (f(a)-f(x))*(d_T(a)-d_T(x))Analizzando i segni
- le frequenze $f (a) - f (x) \geq 0$
- la profondità $d_{T} (a) - d_{T} (x) \geq 0$ Poiché stiamo moltiplicando due numeri non negativi abbiamo che: $B (T) - B (T^{'}) \geq 0 \Rightarrow B (T) \leq B (T^{'})$ visto che $T$ e $T^{'}$ sono uguali allora il loro costo sarà lo stesso. Questo dimostra che la scelta greedy è sicura.

Activity Selector

Generalità: Le attività in $S$ sono ordinate in modo crescente in base al tempo di fine Teorema: Consideriamo un sottoproblema non vuoto $S_{k}$ e sia $a_{m}$ l’attività in $S_{k}$ che ha il primo tempo di fine; allora l’attività $a_{m}$ è inclusa in qualche sottoinsieme massimo di attività mutuamente compatibili di $S_{k}$ (prendiamo quella con il tempo di fine più basso). Dimostrazione: Supponiamo che $A_{k}$ sia un sottoinsieme massimo di attività mutuamente compatibili di $S_{k}$ e sia $a_{j}$ l’attività in $A_{k}$ con il più piccolo tempo di fine.

Se $a_{j} = a_{m}$ , abbiamo finito (l’attività golosa è già nell’insieme ottimo).
Se $a_{j} \neq = a_{m}$ , costruiamo l’insieme $A_{k}^{'} = (A_{k} - {a_{j}}) \cup {a_{m}}$ (sostituiamo $a_{j}$ con $a_{m}$ ).
- Le attività in $A_{k}^{'}$ sono disgiunte perché lo è anche $A_{k}$ e $f_{m} \leq f_{j}$ (poiché $a_{m}$ è la scelta golosa).
- Poiché $∣ A_{k}^{'} ∣ = ∣ A_{k} ∣$ , concludiamo che $A_{k}^{'}$ è un sottoinsieme massimo che include $a_{m}$ .

Dimostrazioni generiche

Hashing con concatenazione

Ricerca senza successo: una ricerca senza successo richiede un tempo di $Θ (1 + α)$ nel caso medio Dimostrazione: Il tempo atteso per ricercare senza successo una chiave $k$ è il tempo atteso per svolgere ricerche fino alla fine della lista $T [h (k)]$ che ha lunghezza attesa di $α$ quindi il tempo totale richiesto (incluso quello per calcolare $h (k)$ che ipotizziamo sia $O (1)$ ) è $Θ (1 + α)$ Ricerca con successo: una ricerca con successo richiede un tempo di $Θ (1 + α)$ nel caso medio Dimostrazione: il numero di elementi esaminati durante una ricerca con successo di un elemento $x$ è uno in più del numero di elementi che si trovano prima di $x$ nella lista di $x$ . Gli elementi prima di $x$ li troviamo facendo: $1 + \sum_{j = i + 1}^{n} P r (x_{ij})$ Ricordiamo che $P r (x_{ij}) = \frac{1}{m}$ . Dunque il numero atteso di elementi esaminati con successo è: $\frac{1}{n} \sum_{i = 1}^{n} (1 + \sum_{j = n + 1}^{n} P r {x_{ij}})$ Di seguito la risoluzione: - Distribuiamo la sommatoria dentro la parentesi e sostituiamo $P r {x_{ij}}$ : $\frac{1}{n} (\sum_{i = 1}^{n} 1 + \sum_{i = 1}^{n} \sum_{j = n + 1}^{n} \frac{1}{m})$ - Riscrivo la prima sommatoria semplicemente come $n$ e sposto fuori la costante $\frac{1}{m}$ : $\frac{1}{n} (n + \frac{1}{m} \sum_{i = 1}^{n} \sum_{j = n + 1}^{n} 1)$ - Riscrivo la sommatoria con $j$ come $n - i$ : $\frac{1}{n} (n + \frac{1}{m} \sum_{i = 1}^{n} (n - i))$ - Riscrivo le sommatorie come differenza di sommatorie $\frac{1}{n} (n + \frac{1}{m} (\sum_{i = 1}^{n} n - \sum_{j = n + 1}^{n} i))$ - Risolvo le sommatorie $\frac{1}{n} (n + \frac{1}{m} (n^{2} - \frac{n ( n + 1 )}{2}))$ - Risolvo i calcoli rimanenti $1 + \frac{1}{mn} (n^{2} - \frac{n ( n + 1 )}{2}) = 1 + \frac{n}{m} - \frac{n + 1}{2 m} \in O (1 + α)$

Hashing con indirizzamento aperto

Ricerca senza successo: data una tavola hash con un fattore di carico $α = n / m < 1$ il numero atteso di ispezioni in una ricerca senza successo è al massimo $\frac{1}{1 - α}$ Dimostrazione:

Ricerca con successo: data una tavola hash con un fattore di carico $α = n / m < 1$ il numero atteso di ispezioni in una ricerca senza successo è al massimo $\frac{1}{α} ln \frac{1}{1 - α}$ Dimostrazione:

Altezza massima

Definizione altezza massima: l’altezza massima di un albero rosso-nero con $n$ nodi interni è $2 lo g_{2} (n + 1)$

Dimostrazione: Iniziamo dimostrando che il sottoalbero con radice in un nodo $x$ qualsiasi contiene almeno $2^{bh (x)} - 1$ nodi interni, lo faremo per induzione:

caso base: Se l’altezza di $x$ è $0$ allora $x$ deve essere una foglia e il sottoalbero con radice in $x$ contiene: $2^{0} - 1 = 1 - 1 = 0$
passo induttivo: consideriamo un nodo $x$ che ha un altezza positiva ed è quindi un nodo interno con due figli. Possiamo dire che ogni figlio ha un altezza nera pari a:
- se rosso ha $bh (x)$
- se nero ha $bh (x) - 1$ (perché escludo il nodo stesso dal conteggio) Poiché l’altezza di un figlio di $x$ è minore dell’altezza di $x$ possiamo applicare l’ipotesi induttiva per concludere che ogni figlio ha almeno $2^{bh (x) - 1} - 1 nodi interni$ e quindi possiamo concludere che il sottoalbero con radice in $x$ contiene: $$ \underbrace{(2^{bh(x)-1}-1)}{\text{nodi interni albero sx}} + \underbrace{(2^{bh(x)-1}-1)}{\text{nodi interni albero dx}} + 1 = 2^{bh(x)} - 1 ;\text{nodi interni}

Per completare la dimostrazione indichiamo con $h$ l'altezza dell'albero, sappiamo che almeno metà dei nodi in qualsiasi cammino semplice della radice ad una foglia deve essere nera, di conseguenza l'altezza nera della radice è $h/2$ (perché lungo il cammino i nodi si alternano rosso/nero) quindi abbiamo che: $$n \ge 2^{h/2}-1$$dove $n$ è il numero di nodi interni del nostro albero. Spostando $1$ nel lato sinistro e prendendo i logaritmi di entrambi i lati otteniamo: $$log_2(n+1) \ge h/2 \; \text{ ovvero } \; h \le 2\log_2(n+1)$$

Andrea Girlando

Explorer

Dimostrazioni

Explorer

Sottostrutture ottime

Rodcut

Matrix

Longest common subsequence

Longest common substring

Distanza di editing

Huffman

Activity selector

Cammini minimi

Scelta greedy

Huffman

Activity Selector

Dimostrazioni generiche

Hashing con concatenazione

Hashing con indirizzamento aperto

Altezza massima

Graph View

Table of Contents

Backlinks