Forma normale di Chomsky

Nella teoria dei linguaggi formali, una grammatica libera dal contesto si dice essere nella forma normale di Chomsky (CNF,^[1] o FNC, dall'inglese Chomsky normal form) (scoperta da Noam Chomsky)^[2] se tutte le sue regole di produzione sono nella forma seguente:^[1]^[3]

A \to B C

o

A \to a

o

S \to ε

,

dove $A$ , $B$ e $C$ sono simboli non terminali, $a$ è un simbolo terminale (un simbolo che rappresenta un valore costante), $S$ è l'assioma di partenza, $ε$ è la stringa vuota, e $B \neq S \land C \neq S$ .

Tutte le grammatiche nella forma normale di Chomsky sono non contestuali e, viceversa, tutte le grammatiche non contestuali possono essere trasformate in grammatiche equivalenti in FNC. Per eseguire tale trasformazione sono stati ideati più algoritmi. Tuttavia, come fatto notare da Lange e Leiß,^[4] lo svantaggio di queste trasformazioni sta nel grande aumento della dimensione della grammatica, dove tale dimensione equivale alla somma delle dimensioni delle regole di produzione, le quali, a loro volta, equivalgono a 1 più la lunghezza della parte destra. Denotando con $| G |$ la dimensione della grammatica originale $G$ , la crescita di tale dimensione nel peggiore dei casi è compresa fra $| G |^{2}$ a $2^{2 | G |}$ (dipende dall'algoritmo di trasformazione utilizzato).

Definizione alternativa

Forma ridotta di Chomsky

Un altro modo per definire la forma normale di Chomsky normal form è:

Una grammatica formale è in forma ridotta di Chomsky se tutte le sue regole di produzione sono nella forma seguente:

A \to B C

o

A \to a

,

dove $A$ , $B$ e $C$ sono simboli non terminali e $a$ è un simbolo terminale. Solo le grammatiche context-free che non ammettono epsilon-produzioni possono essere rese in questa forma.

Forma normale di Floyd

In un articolo in cui propose la Backus-Naur Form (BNF), Donald E. Knuth suggerì una «sintassi [BNF] in cui tutte le definizioni aventi tale forma sono dette essere in "forma normale di Floyd"»:

⟨ A ⟩ : := ⟨ B ⟩ ∣ ⟨ C ⟩

o

⟨ A ⟩ : := ⟨ B ⟩ ⟨ C ⟩

o

⟨ A ⟩ : := a

,

dove $⟨ A ⟩$ , $⟨ B ⟩$ e $⟨ C ⟩$ sono simboli non terminali e $a$ è un simbolo terminale. Il nome si riferisce a Robert W. Floyd, che nel 1961 scoprì che ogni sintassi BFN può essere convertita in tale forma.^[5]

Convertire una grammatica nella FNC

Introdurre $S_{0}$
Introdurre un nuovo simbolo di partenza, $S_{0}$ e una nuova regola $S_{0} \to S$ , dove $S$ è il precedente assioma.
Eliminare tutte le $ε$ -produzioni
Le $ε$ -produzioni sono regole della forma $A \to ε$ , dove $A = S_{0}$ e $A \in V$ e $V$ è l'alfabeto delle variabili della grammatica CF.

Rimuovere ogni regola con $ε$ alla propria destra. Per ogni regola con $A$ alla propria destra, aggiungere un insieme di nuove regole consistente delle possibili combinazioni di $A$ sostituito o meno da $ε$ . Per esempio, esaminando la seguente grammatica $G$ :
$S \to A b A ∣ B$

$B \to b ∣ c$

$A \to ε$

$G$ ha una $ε$ -produzione. Quando $A \to ε$ viene rimossa, la grammatica va modificata nella maniera seguente:
$S \to A b A ∣ A b ∣ b A ∣ b ∣ B$

$B \to b ∣ c$

Da notare che a partire dalla prima regola ne sono state aggiunte tre nuove ( $S \to A b ∣ b A ∣ b$ ), in ciascuna delle quali almeno un simbolo $A$ viene sostituito con $ε$ .
Eliminare tutte le regole unitarie
$A \to B; A, B \in V$

Dopo aver rimosso le $ε$ -produzioni, vanno rimosse tutte le regole unitarie e le regole che nella parte destra non hanno simboli terminali.
Per rimuovere $A \to B$

$\forall B \to U$ , dove $U$ è una stringa di variabili generiche, aggiungere $A \to U$ a meno che non sia una regola unitaria già rimossa.
Sistemare le rimanenti regole di produzione che non sono ancora nella FNC.
Sostituire $A \to u_{1} u_{2} \dots u_{k}, k \geq 3, u_{1} \in V \cup Σ$ con $A \to u_{1} A_{1}, A_{1} \to u_{2} A_{2}, \dots, A_{k - 2} \to u_{k - 1} u_{k}$ , dove $A_{i}$ sono nuove variabili.

Note

↑ ^1,0 ^1,1 Template:Cita.
↑ Template:Cita pubblicazione
↑ Hopcroft, Ullman (1979); Theorem 4.5, sect.4.5, p.92; see also p.106
↑ Template:Cita web
↑ Donald E. Knuth. 1964. Backus Normal Form vs. Backus Naur Form. Communications of the ACM, 7(12):735–736, December.

Bibliografia

Template:Cita pubblicazione
John E. Hopcroft and Jeffrey D. Ullman, Introduction to Automata Theory, Languages and Computation, Addison-Wesley Publishing, Reading Massachusetts, 1979. ISBN 0-201-02988-X. (See chapter 4.)
Template:Cita libro
Template:Cita libro (Pages 237–240 of section 6.6: simplified forms and normal forms.)
Template:Cita libro (Pages 98–101 of section 2.1: context-free grammars. Page 156.)
Template:Cita libro

Voci correlate

Template:Portale

[Ausiello128-1] 1,0 ^1,1 Template:Cita.

[2] Template:Cita pubblicazione

[3] Hopcroft, Ullman (1979); Theorem 4.5, sect.4.5, p.92; see also p.106

[4] Template:Cita web

[knuth1964-5] Donald E. Knuth. 1964. Backus Normal Form vs. Backus Naur Form. Communications of the ACM, 7(12):735–736, December.

[1]

[2]

[3]

[4]

[5]

Forma normale di Chomsky

Indice

Definizione alternativa

Forma ridotta di Chomsky

Forma normale di Floyd

Convertire una grammatica nella FNC

Note

Bibliografia

Voci correlate

Menu di navigazione

Forma normale di Chomsky

Definizione alternativa

Forma ridotta di Chomsky

Forma normale di Floyd

Convertire una grammatica nella FNC

Note

Bibliografia

Voci correlate

Menu di navigazione

Ricerca