Automa a stati finiti probabilistico

Un automa a stati finiti probabilistico è, in matematica e informatica teorica, una generalizzazione degli automi finiti non deterministici dove ogni ad transizione dell'automa è associata una probabilità. Le transizioni sono rappresentate in modo compatto da matrici stocastiche. I linguaggi riconosciuti dagli automi probabilistici sono chiamati linguaggi stocastici; comprendono ed estendono la famiglia dei linguaggi regolari. In particolare, il numero dei linguaggi stocastici non è numerabile; mentre quello dei linguaggi regolari lo è.

Il concetto di automa probabilistico è stato introdotto da Michael O. Rabin nel 1963^[1]^[2]^[3]. Un'estensione di questa definizione porta agli automi quantistici.

Definizione

Un automa probabilistico è fatto da un automa finito non deterministico, dove a ogni transizione è associata una probabilità, ossia un numero reale compreso tra 0 e 1.

Come per un normale automa a stati finiti (non deterministico), un automa probabilistico su un alfabeto $Σ$ è una sestupla $𝒜 = ⟨ Σ, Q, δ, s_{0}, T . π ⟩$ ^[4] con:

$Σ = {a_{0}, a_{1}, \dots, a_{n}}$ insieme finito di simboli chiamato alfabeto
$Q = {s_{0}, s_{1}, \dots, s_{m}}$ insieme finito di stati
$δ : Q \times Σ \to Q$ funzione di transizione fra stati
$s_{0} \in Q$ stato iniziale
$T \subseteq Q$ insieme di stati terminali o finali
$π : Q \times Σ \to [0, 1]^{m + 1}$ probabilità di transizione

Il vettore $π (s, a)$ , detto "probabilità della transizione", è associato a ogni transizione $(p, a)$ definita da $δ$ , con $s \in Q e a \in Σ$ . $π (s, a)$ assume valori reali positivi fra 0 e 1 tali che il suo i+1-esimo elemento $p_{i} (s, a)$ corrisponde alla probabilità di avere $δ (s, a) = s_{i}$ , ossia di andare a finire in $s_{i}$ dopo aver letto $a$ in $s$ .

La somma delle probabilità è uguale a 1. Ponendo $p_{i} (s, a) = 0$ se $(s, a)$ non ha una transizione in $s_{i}$ , questa condizione si esprime, per ogni stato $s$ e ogni lettera $a$ :

\sum_{i} p_{i} (s, a) = 1

Si definiscono delle matrici stocastiche $P (a)$ per ogni lettera $a \in Σ$ , tali che

P (a)_{s, i} = p_{i} (s, a)

La funzione $π$ si estende alle parole^[4]. Sia $w$ una parola e sia $s_{j} \overset{w}{\to} s_{i}$ un cammino da $s_{j}$ a $s_{i}$ con l'etichetta $w$ . La probabilità di questo cammino è il prodotto delle probabilità delle transizioni che lo compongono. La probabilità $p_{i} (s_{j}, w)$ è definita come la somma delle probabilità dei cammini $s_{j} \overset{w}{\to} s_{i}$ da $s_{j}$ a $s_{i}$ con l'etichetta $w$ . Questa definizione si esprime matricialmente con la matrice $Q \times Q$ , prodotto delle matrici $P (a_{1}), P (a_{2}), \dots, P (a_{n})$ :

P (w) = P (a_{1}) P (a_{2}) \dots P (a_{n})

con $w = a_{1} a_{2} \dots a_{n}$ . Quindi si ha $P (w)_{s_{j}, s_{i}} = p_{i} (s_{j}, w)$ .

La "probabilità di accettazione" di una parola $w$ da parte dell'automa probabilistico $𝒜$ è la somma sugli stati terminali $t_{i} \in T$ delle probabilità $π (s_{0}, w)$ , dove $s_{0}$ è lo stato iniziale. Questa probabilità si scrive anche $π_{𝒜} (w)$ . Anche questo valore si può esprimere in forma matriciale:

π_{𝒜} (w) = λ P (w) γ

dove $λ$ è il $Q$ -vettore linea i cui valori sono tutti zero tranne quello di indice $i$ , che vale 1, e dove $γ$ è il $Q$ -vettore colonna con i valori tutti zero eccetto quelli il cui indice è in $T$ , che valgono 1.

Esempio

Prendiamo l'esempio a destra di un automa a quattro stati, le matrici $P (a)$ e $P (b)$ e vettori $λ$ e $γ$ sono dati da:

λ = (1, 0, 0, 0) P (a) = (\begin{matrix} 0 & \frac{3}{4} & \frac{1}{4} & 0 \\ 0 & 1 & 0 & 0 \\ \frac{1}{2} & \frac{1}{2} & 0 & 0 \\ 0 & 0 & 0 & 1 \end{matrix}) P (b) = (\begin{matrix} 1 & 0 & 0 & 0 \\ 0 & 0 & \frac{1}{2} & \frac{1}{2} \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 1 \end{matrix}) γ = (\begin{matrix} 0 \\ 0 \\ 1 \\ 0 \end{matrix})

Ad esempio, abbiamo $λ P (a) P (b) = (0, 0, \frac{3}{8}, \frac{5}{8})$ , con la probabilità di accettare $a b$ che è pertanto $λ P (a) P (b) γ = 3 / 8$ .

Linguaggio stocastico

Soglia di accettazione

Sia $η$ un numero reale tale che $0 \leq η < 1$ . Il linguaggio accettato dall'automa probabilistico $𝒜$ con soglia $η$ è l'insieme delle parole la cui probabilità di accettazione è maggiore di $η$ . Questo linguaggio stocastico è $L (𝒜, η)$ , definito da

L (𝒜, η) = {w \in A^{*} ∣ λ P (w) γ > η}

Il numero $η$ è chiamato "soglia" o cut point.

Un cut point è detto "isolato" se esiste un numero reale $δ > 0$ tale che, per ogni parola $w$ , si ha

| π_{𝒜} (w) - η | \geq δ

Proprietà

Tutti i linguaggi regolari sono stocastici e alcune restrizioni dei linguaggi stocastici sono regolari:

Ogni linguaggio stocastico la cui soglia è 0 è razionale.
Ogni linguaggio stocastico isolato è razionale.

Di contro, non vi è l'uguaglianza, come mostra l'esempio seguente.

Esempio di un linguaggio stocastico che non è regolare

Sia l'automa $𝒜$ a due stati sull'alfabeto binario dato dalle matrici:

λ = (1, 0) P (0) = (\begin{matrix} 1 & 0 \\ \frac{1}{2} & \frac{1}{2} \end{matrix}) P (1) = (\begin{matrix} \frac{1}{2} & \frac{1}{2} \\ 0 & 1 \end{matrix}) γ = (\begin{matrix} 0 \\ 1 \end{matrix})

Per una parola binaria $w = b_{1} b_{2} \dots b_{n}$ , il coefficiente $P (w)_{1, 2}$ della matrice $P (w)$ è uguale a

P (w)_{1, 2} = \sum_{j = 1}^{n} b_{j} 2^{n + 1 - j}

;

Questo è il numero razionale che si può scrivere in notazione binaria $0, b_{n} b_{n - 1} \dots b_{1}$ . Per un valore di $η$ , il linguaggio $L (𝒜, η)$ accettato da questo automa è quindi l'insieme di parole che rappresentano un numero binario maggiore di $η$ . È chiaro che se $η < η^{'}$ , allora $L (𝒜, η) \subset L (𝒜, η^{'})$ e questa inclusione è rigorosa. Di conseguenza, esiste un numero non numerabile di linguaggi della forma $L (𝒜, η)$ per questo automa; poiché il numero di linguaggi regolari è numerabile, ciò implica l'esistenza di linguaggi stocastici che non sono regolari.

Problemi di decidibilità

La maggior parte dei problemi sono indecidibili^[5]. Questi problemi possono essere formulati anche mediante quella che viene chiamata "immagine" di un automa a stati finiti probabilistico, definito come l'insieme $Ω (𝒜) = {π_{𝒜} (w) ∣ w \in A^{*}}$ .

Il problema di sapere se il linguaggio $L (𝒜, η)$ accettato è vuoto o no, è indecidibile per $0 < η < 1$ . Equivale al problema di sapere se $Ω (𝒜)$ contiene un valore maggiore di $η$ .

Il problema di sapere se un numero $η$ è una cut point isolato per un automa $𝒜$ , è indecidibile. Equivale al problema di sapere se c'è un intervallo aperto centrato intorno $η$ disgiunto da $Ω (𝒜)$ .

Sapere se esiste un numero $η$ che è un cut point isolato per $𝒜$ , è indecidibile. Equivale a sapere se $Ω (𝒜)$ è denso nell'intervallo $[0, 1]$ .

Note

Bibliografia

Voci correlate

Template:Portale

[1] Template:Cita.

[2] Template:Cita.

[3] Template:Cita libro

[rab234-4] 4,0 ^4,1 Template:Cita

[5] Template:Cita pubblicazione

[1]

[2]

[3]

[4]

[5]

Automa a stati finiti probabilistico

Indice

Definizione

Esempio

Linguaggio stocastico

Soglia di accettazione

Proprietà

Esempio di un linguaggio stocastico che non è regolare

Problemi di decidibilità

Note

Bibliografia

Voci correlate

Menu di navigazione

Automa a stati finiti probabilistico

Definizione

Esempio

Linguaggio stocastico

Soglia di accettazione

Proprietà

Esempio di un linguaggio stocastico che non è regolare

Problemi di decidibilità

Note

Bibliografia

Voci correlate

Menu di navigazione

Ricerca