 |
Nertila |
| un genoma è un insieme di geni che appartengono a ... |
05-07-2006 16:52 |
|
 |
Nertila |
.amico.
Registered: May 2003
Posts: 26 (0.00 al dì)
Location:
Corso:
Anno:
Time Online: 1 Day, 22:16:34 [...]
Status: Offline
Edit | Report | IP: Logged |
un genoma è un insieme di geni che appartengono al insieme base e che si trovano nel codice genetico. questi geni non si devono sovrapporrere e uno deve precedere l'altro.
il genoma ha lungh. max il max. nr. di geni che troviamo nel codice con queste propietà.
|
|
05-07-2006 16:52 |
|
|
|  |
 |
maynard80 |
| [QUOTE][i]Originally posted by Nertila [/i]
... |
05-07-2006 17:30 |
|
 |
maynard80 |
.novellino.

Registered: Jul 2007
Posts: 3 (0.00 al dì)
Location: Milano (e non interland, tendo a precisare)
Corso: informatica
Anno: SESTO
Time Online: 12 Days, 14:28:38 [...]
Status: Offline
Edit | Report | IP: Logged |
Originally posted by Nertila
un genoma è un insieme di geni che appartengono al insieme base e che si trovano nel codice genetico. questi geni non si devono sovrapporrere e uno deve precedere l'altro.
il genoma ha lungh. max il max. nr. di geni che troviamo nel codice con queste propietà.
ehm... si è palese.... ehm...... beh ok, forse a qualcuno potrebbe servire riassumere in maniera semplificata le richieste del progetto... no così... è solo un'idea.

__________________
msn Messenger: giamma80 at tiscali.it
ATHENA !
|
|
05-07-2006 17:30 |
|
|
|  |
 |
logan.x |
| [QUOTE][i][B]Originally posted by maynard80 [/B][/ ... |
05-07-2006 22:27 |
|
 |
logan.x |
.amico.

Registered: Jul 2003
Posts: 36 (0.00 al dì)
Location: milano
Corso: informatica triennale
Anno: 2° fuori corso
Time Online: 19:13:22 [...]
Status: Offline
Edit | Report | IP: Logged |
Originally posted by maynard80
ehm... si è palese.... ehm...... beh ok, forse a qualcuno potrebbe servire riassumere in maniera semplificata le richieste del progetto... no così... è solo un'idea.
Questo e' quello che ho capito io:
i geni sono composti da una stringa finita di caratteri e sono raggruppati in una base s.
la concatenazione di piu' geni (basati sulla base s) compone il codice genetico.
dato un codice genetico individuare la sequenza di geni che la compone (genoma).
dato che ci sono piu' combinazioni possibili di genoma, bisogna prendere quella con il maggior numeri di geni facendo attenzione che i geni non si sovrappongano. inoltre se un gene compare piu' volte, bisogna prendere la prima occorrenza.
identificato il genoma creare la proteina la quale ha un costo di attivazione e un costo di passaggio. questi costi sono da calcolare sulla base di piu' istanze di codice genetico. il costo di attivazione varia a parita' di gene tra un'istanza e l'altra e il costo di passaggio e' il costo del "salto" tra un'istanza e l'altra. trovare la sequenza minima a livello di costi che compone la proteina.
lo so, spiegarlo in parole "umane" e' difficile. io ho impiegato 2 giorni a capirlo, pero' che volete farci... sono un mutante!! 
delucidazioni migliori della mia sono ben accette (sempre che io abbia capito bene).
|
|
05-07-2006 22:27 |
|
|
|  |
 |
Petrik22 |
| ragazzi ma c'è qualcuno disposto a beccarsi in si ... |
06-07-2006 09:50 |
|
 |
Petrik22 |
:the broser:

Registered: Jul 2003
Posts: 76 (0.01 al dì)
Location: Seregno
Corso: TICom
Anno: ultimo
Time Online: 1 Day, 5:39:38 [...]
Status: Offline
Edit | Report | IP: Logged |
ragazzi ma c'è qualcuno disposto a beccarsi in silab per buttare giù le basi di sto progetto???
almeno capire cosa fare e come, poi ovviamente il codice definitivo lo si deve scrivere individualmente...
se qualcuno è interessato mi faccia sapere!!!
|
|
06-07-2006 09:50 |
|
|
|  |
 |
maynard80 |
| [QUOTE][i]Originally posted by Petrik22 [/i]
... |
06-07-2006 10:41 |
|
 |
maynard80 |
.novellino.

Registered: Jul 2007
Posts: 3 (0.00 al dì)
Location: Milano (e non interland, tendo a precisare)
Corso: informatica
Anno: SESTO
Time Online: 12 Days, 14:28:38 [...]
Status: Offline
Edit | Report | IP: Logged |
Originally posted by Petrik22
ragazzi ma c'è qualcuno disposto a beccarsi in silab per buttare giù le basi di sto progetto???
almeno capire cosa fare e come, poi ovviamente il codice definitivo lo si deve scrivere individualmente...
se qualcuno è interessato mi faccia sapere!!!
ma io ci sto, se riusciamo a fare un gruppo non è male
__________________
msn Messenger: giamma80 at tiscali.it
ATHENA !
|
|
06-07-2006 10:41 |
|
|
|  |
 |
Petrik22 |
| okey io sono disponibile per settimana prox quando ... |
06-07-2006 15:29 |
|
 |
Petrik22 |
:the broser:

Registered: Jul 2003
Posts: 76 (0.01 al dì)
Location: Seregno
Corso: TICom
Anno: ultimo
Time Online: 1 Day, 5:39:38 [...]
Status: Offline
Edit | Report | IP: Logged |
okey io sono disponibile per settimana prox quando volete, intanto sto lavorando così possiamo confrontare un po' ciò che abbiamo già fatto...
se qualcuno si vuole unire è strabenvenuto!!!
__________________
lol
|
|
06-07-2006 15:29 |
|
|
|  |
 |
Bibendus |
| Ma una cosa non ho capito... il costo per produrre ... |
08-07-2006 11:45 |
|
 |
Bibendus |
.precettore.
Registered: Dec 2003
Posts: 82 (0.01 al dì)
Location: Novara
Corso: Informatica
Anno: 4
Time Online: 10:37:11 [...]
Status: Offline
Edit | Report | IP: Logged |
Ma una cosa non ho capito... il costo per produrre la proteina e' indipendente dalla composizione del genoma?
Cioe alla fine calcoliamo i costi solo in base ad una matrice no? L'unica cosa che lega il calcolo dell'energia al genoma è la lunghezza stessa del genoma, giusto?
|
|
08-07-2006 11:45 |
|
|
|  |
 |
maynard80 |
| ragazzi qualcuno ha idee? io ci sto impazzendo die ... |
08-07-2006 12:36 |
|
 |
maynard80 |
.novellino.

Registered: Jul 2007
Posts: 3 (0.00 al dì)
Location: Milano (e non interland, tendo a precisare)
Corso: informatica
Anno: SESTO
Time Online: 12 Days, 14:28:38 [...]
Status: Offline
Edit | Report | IP: Logged |
ragazzi qualcuno ha idee? io ci sto impazzendo dietro
__________________
msn Messenger: giamma80 at tiscali.it
ATHENA !
|
|
08-07-2006 12:36 |
|
|
|  |
 |
logan.x |
| [QUOTE][i]Originally posted by maynard80 [/i]
... |
10-07-2006 11:14 |
|
 |
logan.x |
.amico.

Registered: Jul 2003
Posts: 36 (0.00 al dì)
Location: milano
Corso: informatica triennale
Anno: 2° fuori corso
Time Online: 19:13:22 [...]
Status: Offline
Edit | Report | IP: Logged |
Originally posted by maynard80
ragazzi qualcuno ha idee? io ci sto impazzendo dietro
Devo dire che e' stata molto dura capire il testo.
Per me ci sono 3 algoritmi da individuare:
1) dato il codice genetico, individuare i geni contenuti nel codice, se un gene appare piu' volte, prendere SOLO la prima occorrenza. (String matching) Facile.
2) individuati i geni (punto 1), costruire la sequenza di geni piu' lunga possibile facendo attenzione alla sovrapposizione degli stessi. (algo sul libro) Facile. Qui fate attenzione, sul testo c'e' scritto che possono esserci piu' di un genoma compatibile e che puo' essere una sequenza vuota.
3) individuato il genoma (punto 2), costruire la proteina:
vengono date n istanza del codice genetico. Prendere i geni del genoma tra le n istanze di "t" minimizzando i costi di attivazione e (eventualmente) di passaggio (algo sul libro, quello consigliato) Difficile
Individuati i punti 1-2-3, capire quale sia la migliore struttura dati.
Io uso una lista doppiamente linkata ma devo capire ancora se va bene per il punto 3.
Per la stampa dei genomi con prefisso "alfa", vedo se riesco a riciclare la procedura del punto 1.
Bye.
Originally posted by maynard80
Ma una cosa non ho capito... il costo per produrre la proteina e' indipendente dalla composizione del genoma?
Cioe alla fine calcoliamo i costi solo in base ad una matrice no? L'unica cosa che lega il calcolo dell'energia al genoma è la lunghezza stessa del genoma, giusto?
istanza t1: GATTACATTAGAGCGCCCCAAATATAT
istanza t2: GATTACATTAGAGCGCCCCAAATATAT
ovviamente le istanze di t possono essere n
genoma (siamo gia' al punto 3) per esempio composto da GATTA, TAGA, TATAT
Il calcolo dell'energia, piu' che dipendere dalla lunghezza del genoma, dipende da quale istanza di "t" prendi il gene. Ovviamente non puoi provare tutte le possibili combinazioni, altrimenti l'algoritmo ha un costo proibitivo. Sembra quasi.... ehm.... una catena di montaggio....
Last edited by logan.x on 11-07-2006 at 15:14
|
|
10-07-2006 11:14 |
|
|
|  |
 |
longgoneday |
| [QUOTE][i]Originally posted by logan.x [/i]
... |
10-07-2006 11:43 |
|
 |
longgoneday |
.precettore.
Registered: Jun 2003
Posts: 87 (0.01 al dì)
Location: MI
Corso: informatica
Anno: 2
Time Online: 1 Day, 23:40:28 [...]
Status: Offline
Edit | Report | IP: Logged |
Originally posted by logan.x
2) individuati i geni (punto 1), costruire la sequenza di geni piu' lunga possibile facendo attenzione alla sovrapposizione degli stessi. (algo sul libro) Facile. Qui fate attenzione, sul testo c'e' scritto che possono esserci piu' di un genoma compatibile e che puo' essere una sequenza vuota.
3) individuato il genoma (punto 2), costruire la proteina:
vengono date n istanza del codice genetico. Prendere i geni del genoma tra le n istanze di "t" minimizzando i costi di attivazione e (eventualmente) di passaggio (algo sul libro, quello consigliato) Difficile
sapresti dirmi a quali algoritmi sul libro ti riferisci esattamente?a che pagina?io ho l'edizione vecchia e non so se ci sono...
graziemille
|
|
10-07-2006 11:43 |
|
|
|  |
 |
MarcoAnselmo |
| Io non ho alcun libro, logan.x non è che puoi met ... |
10-07-2006 15:21 |
|
 |
MarcoAnselmo |
.fedelissimo.

Registered: Jun 2005
Posts: 44 (0.01 al dì)
Location: Milano
Corso: Informatica
Anno: 3
Time Online: 20:39:02: [...]
Status: Offline
Edit | Report | IP: Logged |
Io non ho alcun libro, logan.x non è che puoi mettere nell'area filez le scansioni delle pagine interessate?
Anche perché così a occhio senza un testo da cui prendere spunto non sembra così facile...
Io un'ipotesi su come fare la funzione genoma ce l'ho, ma è piuttosto complicata. Appena ho un po' di tempo la testo e poi la condivido. Per la proteina non mi ci sono ancora messo!
|
|
10-07-2006 15:21 |
|
|
|  |
 |
maynard80 |
| per il punto uno penso che siano gli algo conosciu ... |
10-07-2006 15:59 |
|
 |
maynard80 |
.novellino.

Registered: Jul 2007
Posts: 3 (0.00 al dì)
Location: Milano (e non interland, tendo a precisare)
Corso: informatica
Anno: SESTO
Time Online: 12 Days, 14:28:38 [...]
Status: Offline
Edit | Report | IP: Logged |
per il punto uno penso che siano gli algo conosciuti di string-matching(Naìve, Knuth-Morris-Pratt ,Boyer Moore )
per i punti 2 e 3 il vuoto...
__________________
msn Messenger: giamma80 at tiscali.it
ATHENA !
|
|
10-07-2006 15:59 |
|
|
|  |
 |
Bibendus |
| Boh sto cercando di capire che algoritmo si potreb ... |
10-07-2006 17:25 |
|
 |
Bibendus |
.precettore.
Registered: Dec 2003
Posts: 82 (0.01 al dì)
Location: Novara
Corso: Informatica
Anno: 4
Time Online: 10:37:11 [...]
Status: Offline
Edit | Report | IP: Logged |
Boh sto cercando di capire che algoritmo si potrebbe usare al punto 2.
Abbiamo una serie di intervalli (posizione prima lettera, posizione ultima lettera) per cui i geni sono stati individuati nel codice genetico, bisogna fare in modo di trovare piu intervalli possibili che non si sovrappongano.
Provo a spararla... credo che centri qualcosa con le code di priorità, abbiamo un tempo di inizio (posizione prima lettera) e un tempo di lavoro (lunghezza della stringa) e dobbiamo fare in modo di eseguire piu processi possibili (occorrenza di piu geni che non si sovrappongono)
Che ne pensate?
Per la terza parte... boh non ho capito come facciamo ad avere un file che contiene gia le istanze a n valori se non sappiamo quanto varrà n, cioè non sappiamo ancora qual'è la lunghezza massima della sequenza di geni compatibile con il codice genetico (fase 2).
Inoltre ripeto, per la fase 3 non mi pare ci interessi quali geni abbiamo trovato ma quanti.
Il costo dell'energia potrebbe sembrare molto ad una catena di montaggio però non ne sono tanto sicuro.
Abbiamo un costo di produzione sulle singole istanze e il costo per spostarsi da un istanza all'altra.
Provo a leggermi un po l'esempio sul libro (sezione programmazione dinamica)
|
|
10-07-2006 17:25 |
|
|
|  |
 |
Bibendus |
| Ok confermo che per la terza fase si tratta sicura ... |
11-07-2006 00:04 |
|
 |
Bibendus |
.precettore.
Registered: Dec 2003
Posts: 82 (0.01 al dì)
Location: Novara
Corso: Informatica
Anno: 4
Time Online: 10:37:11 [...]
Status: Offline
Edit | Report | IP: Logged |
Ok confermo che per la terza fase si tratta sicuramente di programmazione dinamica, l'esempio della catena di montaggio calza a pennello.
|
|
11-07-2006 00:04 |
|
|
|  |
 |
logan.x |
| [QUOTE][i]Originally posted by Bibendus [/i]
... |
11-07-2006 13:40 |
|
 |
logan.x |
.amico.

Registered: Jul 2003
Posts: 36 (0.00 al dì)
Location: milano
Corso: informatica triennale
Anno: 2° fuori corso
Time Online: 19:13:22 [...]
Status: Offline
Edit | Report | IP: Logged |
Originally posted by Bibendus
Provo a spararla... credo che centri qualcosa con le code di priorità, abbiamo un tempo di inizio (posizione prima lettera) e un tempo di lavoro (lunghezza della stringa) e dobbiamo fare in modo di eseguire piu processi possibili (occorrenza di piu geni che non si sovrappongono)
Che ne pensate?
Secondo me non ti serve nessuna coda di priorita'.
Potrebbe andar bene un algo greedy.
Immaginiamo che i geni siano dei processi con un tempo di inizio e uno di fine da eseguire su un monoprocessore. Se li ordiniamo in base al tempo di fine e poi ci ragioniamo un po' su... la sequenza viene fuori in un attimo.
Originally posted by Bibendus
Per la terza parte... boh non ho capito come facciamo ad avere un file che contiene gia le istanze a n valori se non sappiamo quanto varrà n, cioè non sappiamo ancora qual'è la lunghezza massima della sequenza di geni compatibile con il codice genetico (fase 2).
In effetti, questo passo e' complicato.
A mio avviso:
a) la funzione genoma, per ogni gene inserito nella base ne trova la prima occorrenza nel codice genetico. Alla fine, restituisce la massima sequenza compatibile con le regole del progetto (quindi sai quanto e' lunga).
b) la funzione proteina, prima lancia genoma, poi in base ai valori di r e c contenuti nel file f.txt, crea r istanze del codice genetico e a quel punto devi calcolare il costo della proteina. Guarda il mio ultimo post.
Supponi che r sia = 2. Prendi GATTA e TAGA dalla 1° istanza mentre TATAT della 2° istanza. Il totale e' per esempio 34.
Invece se prendi GATTA dalla 1° istanza mentre TAGA e TATAT della 2° istanza il totale e' 29. Questa e' la sequenza migliore.
Tieni presente che non devi ricercare il gene nell'istanza, sai gia' le posizioni. Come si fa? La risposta concettuale e' nell'ultima riga del mio precedente post.
P.s. Ah, fate attenzione. Bisogna gestire il caso che il genoma sia costituito dalla sequenza vuota (= no geni)!!
Last edited by logan.x on 11-07-2006 at 14:04
|
|
11-07-2006 13:40 |
|
|
|  |
 |
| All times are GMT. The time now is 03:06. |
|
|
 |
|
 |
|
|
|  |
Forum Rules:
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts
|
HTML code is OFF
vB code is ON
Smilies are ON
[IMG] code is ON
|
|
|
|
|
|