/+junk/Dataanalys

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/%2Bjunk/Dataanalys

« back to all changes in this revision

Viewing changes to latex/rapport.tex

  • Committer: Gusatv Hartvigsson
  • Date: 2011-02-08 13:48:12 UTC
  • Revision ID: gustav.hartvigsson@gmail.com-20110208134812-b61fni3hgl2zyei8
finnished the section, I hope... now only the data annalasys is left.
and then QC I ald QC II.

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
\documentclass{article}
 
2
 
 
3
\usepackage[utf8]{inputenc}
 
4
\usepackage[T1]{fontenc}
 
5
\usepackage[swedish]{babel}
 
6
\usepackage{rotating}
 
7
\usepackage{epstopdf}
 
8
\usepackage{graphicx}
 
9
 
 
10
\usepackage[sorting=none]{biblatex}
 
11
\bibliography{bibogrophy}
 
12
 
 
13
\title{Projektarbete: Dataanalys}
 
14
\author{Gustav Hartvigsson \\
 
15
Grebbestads Folkhögskola (VT 2011) \\
 
16
gustav.hartvigsson@gamil.com}
 
17
 
 
18
\begin{document}
 
19
  \maketitle
 
20
  
 
21
  \pagebreak
 
22
  
 
23
  \tableofcontents
 
24
  
 
25
  \pagebreak
 
26
  
 
27
  \part{Intro}
 
28
  \section{Projektets syfte}
 
29
  Syftet som jag hadde I projektplanen var följande:
 
30
  \begin{quote}
 
31
    Att träna på dataanalys/lära sig hur man gör dataanalys.
 
32
  \end{quote}
 
33
  
 
34
  En längre beskrinving kunde vara: \emph{Att träna på dataanalys/lära sig hur
 
35
  datanalys går till och se på olika metoder för att göra detta på.}
 
36
  %FIXME
 
37
  
 
38
  \section{Frågeställning}
 
39
  Frågeställningen som jag hadde i projektplanen är följaned:
 
40
  \begin{quote}
 
41
    Se hur relationen mellan olika frågeställningar ser ut.
 
42
  \end{quote}
 
43
  
 
44
  En längre och mer utförlig frågeställning skulla kunna vara: \emph {Se hur
 
45
  relationen mellan olika svar är. Se tillexempel hur många veganer som är
 
46
  för dödsstraff.}
 
47
  %FIXME
 
48
  
 
49
  \section{Metod}
 
50
  Metoden beskrev jag i projektpalen är som följande:
 
51
  \begin{quote}
 
52
    Skriva en enkät med olika frågor som besvaras med kryssrutor.
 
53
    
 
54
    Sedan stoppa in svaren i ett kalkylblad alt. en databas. där man kan göra
 
55
    förfrågningar (querys) och skapa sig en bild av de olika grupperna på
 
56
    skolan.
 
57
  \end{quote}
 
58
  
 
59
  Jag är ganska nöjd med med hur den är formuleringen. så jag anser inte att jag
 
60
  behöver ändra den.
 
61
  
 
62
  \section{Presentation}
 
63
  Jag hadde en presentation 2011 02 02, denna presentation skrevs i \LaTeX
 
64
  \cite{latex.org:main} \cite{LaTeXWiki} och Beamer.
 
65
  
 
66
  I Projektplanen skev jag följande:
 
67
  \begin{quote}
 
68
    Göra en presentation som redogör för relationerna mellan olika svar.
 
69
    Även eventuellt göra ett program som kan göra querys på ett enkelt sätt.
 
70
    
 
71
    Jag har tänkt att skriva presentationen i \LaTeX \ och visa upp programmet
 
72
    som jag skrev.
 
73
  \end{quote}
 
74
  
 
75
  I den här rapporten tänkte jag framföra lite statestik som visar olika
 
76
  fågeställningar och deras relationer till varandra.
 
77
  
 
78
  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
79
  \part{main}
 
80
  \section{varför jag valde de tekniker som jag gjorde}
 
81
  
 
82
  \subsection{Programmet}
 
83
  När jag tänkte på hur jag skulle lösa problemet kom jag att tänka på att det
 
84
  vore lätt att ha all data i en sqldatabas och sedan använda sql förfrågningar
 
85
  för att ta ut relationerna och räkna instanserna där det är sant.
 
86
  
 
87
  Sedan behövde jag ett lätt använt språk att skriva en ``front-end'' i som jag
 
88
  skulle kunna använda den för att lägga in data och ta ut data med. Med dessa
 
89
  kriterier så blev valet Python 3.X \cite{Python.org:main} (även känt som
 
90
  python py3k eller Python3k) detta blev dock ett problem, mer om detta i
 
91
  sectionen ``Problem'' längre ner.
 
92
  
 
93
  När det gäller valet av databas så var det inte så svårt, jag har arbetat med
 
94
  SQLite förut och kräver inte en bakänsserver som jag skulle behöva använda
 
95
  om ja hadde valt tillexempel MySql \cite{MySqlWiki} eller PostgreSql
 
96
  \cite{PostgreSqlWiki}.
 
97
  
 
98
  \subsection{Enkäten}
 
99
  Enkäten skrev jag i klartext, dvs oformaterad och med bara stanard tecken för
 
100
  att det skulla vara lätt att använda i Bazaar (se längre ner). och att det
 
101
  skulle vara lätt att redegera.
 
102
  
 
103
  enkätens struktur är som följande:
 
104
  \begin{verbatim}
 
105
Först kom en kort beskrivning av projectet
 
106
 
 
107
sedan en liten information om hur datan skulle användas
 
108
 
 
109
sedan frågorna:
 
110
 
 
111
Fråga 1:
 
112
    Tror du på en/flera personlig(a) gud/gudar?
 
113
    Ja [ ] Nej [ ]
 
114
 
 
115
ect ect.....
 
116
  \end{verbatim}
 
117
  
 
118
  \subsection{Bazaar}
 
119
  Jag använde Bazaar (även känt som bzr) som ett revitions kontroll system (RCV)
 
120
  för att hålla koll på koden och som ett slags av dagbok över ändringar jag har
 
121
  gjort.
 
122
  
 
123
  här kommer en beskrivning om vad Bazaar är för något frän Bazaars hemside:
 
124
  \begin{quote}
 
125
    Bazaar is a version control system that helps you track project history over
 
126
    time and to collaborate easily with others. Whether you're a single
 
127
    developer, a co-located team or a community of developers scattered across
 
128
    the world, Bazaar scales and adapts to meet your needs. Part of the GNU
 
129
    Project, Bazaar is free software sponsored by Canonical.
 
130
    \cite{bazaar:com:main}
 
131
  \end{quote}
 
132
  
 
133
  \section{Problem}
 
134
  
 
135
  När jag började på projektet hadde jag en idé om att det skulle vara lätt att
 
136
  produsera en enkär och sammanställa det i en databas, men värkligheten var
 
137
  inte så lätt. I den här sektionen kommer jag att berätta om de problem jag har
 
138
  haft under projektets gång.
 
139
  
 
140
  \subsection{Programmet}
 
141
  Jag hadde lite problem när jag gjorde progremmet som jag gjorde, här kommer
 
142
  lite exempel på det som jag träffadepå.
 
143
  
 
144
  \subsubsection{Bibliotek}
 
145
  När jag valde Python visste jag att det fanns mängder av bibliotek som kunde
 
146
  användas för att att gita grafer i, men jag tänkte inte på att de inte fanns
 
147
  i Python 3k. Detta resulterade i att jag inte kunde göra grafer i pogramet som
 
148
  jag skerv. jag gjorde en ``utflyckt'' i konsten att porta från ett py2.x till
 
149
  py3k (se \cite{LP:GH:PGCP3k}), men jag lade ner det effter som att jag inte
 
150
  förstod hur bibleoteket fungerade. Det ända jag gjorde var en enkel portning
 
151
  så, trotts att den var användbbar, hadde den inte alla funktioner som
 
152
  orginalet hadde.
 
153
  
 
154
  \subsubsection{debugning}
 
155
  Jag utförde aldrig någon ordentlig debuging innan jag försökte lägga in
 
156
  svaren i databasen, detta resulterade I att programmet krachade vid andra
 
157
  körningen av ``add to db''. Felet var att jag inte ränsade strängen som jag
 
158
  sedan använde för att lägga till data i databasen innan jag började på med att
 
159
  lägga till mer data till den.
 
160
  
 
161
  Detta blev fixat i revition med namnet ``\texttt{
 
162
  gustav.hartvigsson@gmail.com- 20110131122114-e6e1z0pl2eadau65 }''
 
163
  (se \texttt{bzr glog} eller \texttt{bzr log}). 
 
164
  %FIXME:
 
165
  %lägg upp koden på LP och referera till den där istället.....?
 
166
  
 
167
  \subsection{Enkät}
 
168
  När det kommer till enkäter så var det lite problem. Bland annat så var inte
 
169
  svarsrutorna för fråga 9 inte på samma sida som frågan.
 
170
  
 
171
  Ett annat problem var att jag stavade fel på frågan 4 och 20, där jag skrev
 
172
  \emph{sekelärt} istället för \emph{sekulärt} och \emph{morerna} istället för
 
173
  \emph{mordärna}.
 
174
  
 
175
  Andra problem som var med själva frågeställningen var att vissa inte ville
 
176
  svara på med ett klart ja eller nej. Detta var ett problem som jag skulle ha
 
177
  förutsätt när jag gjorde frågorna,men det gjorde jag inte.
 
178
  
 
179
  Ett tredje problem som jag hadde var att vissa inte svarade på vissa frågor.
 
180
  Mer om detta längre ner.
 
181
  
 
182
  \part{data och analys}
 
183
  Här kommer jag att skriva om der data analysen gick till och hur jag löste
 
184
  vissa problem som uppstod, och eventuellt visa någon fin graf som visar hur
 
185
  de olika reationerna ser ut.
 
186
  
 
187
  \section{rådata}
 
188
  Jag fick in 44 svar på enkäten, som nu mera finns i en databas, som jag kommer
 
189
  att lägga ut på nätet innom en snar framtid tillsammans med programmet.%FIXME
 
190
  
 
191
  Så här ser ett stycke av databasen ut i csv format.
 
192
  \begin{verbatim}
 
193
id,gudar,spoken,religos,sekulart,vegan,mars,globaluppvarmning [...]
 
194
1,0,0,0,1,0,1,1,1,0,0,0,1,0,1,1,1,1,0,1,1,0,0,1," "
 
195
2,0,0,0,1,0,0,1,1,1,1,1,1,1,0,1,1,1,0,1,1,0,1,1," "
 
196
3,0,0,0,0,0,0,1,1,0,1,1,1,1,1,1,1,1,0,1,1,0,1,1," "
 
197
4,0,0,0,1,0,1,1,1,1,1,1,0,1,0,1,1,1,0,1,1,0,1,0," "
 
198
5,0,0,0,1,0,1,1,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0," "
 
199
6,1,1,0,1,0,1,1,1,0,1,1,1,1,0,1,1,1,0,1,1,0,1,0," Du skull [...]
 
200
  \end{verbatim}
 
201
  Se \texttt{csv/awnsers2.cvs} för datan i csv format %FIXME Länka till datan på LP när den är upplaggd.
 
202
  eller \texttt{awnsers.sqlite} för datan i SQLite3 format.
 
203
  
 
204
  Datans struktur är inte så märkvärdig: 1 är sannt och 0 är falskt.
 
205
  
 
206
  \section{tabeller och grafer.}
 
207
  
 
208
  I den här sektienen kommer jag att gå genom lite statestik äver vilka
 
209
  kopplingar som finns mellan olika frågeställningar som var med i enkäten.
 
210
  
 
211
  \begin{center}
 
212
    \begin{table}[h!]
 
213
      \centering
 
214
      \begin{tabular}{ c | c | c | c | c | c | c | c | c | c | }
 
215
        &
 
216
        \begin{sideways} Tror på gu(ar) \end{sideways} &
 
217
        \begin{sideways} Tror på spöken \end{sideways} &
 
218
        \begin{sideways} Är religös \end{sideways} &
 
219
        \begin{sideways} Är för ett sekulärt sammhälle \ \end{sideways} &
 
220
        \begin{sideways} Vegan eller vegitarian \end{sideways} &
 
221
        \begin{sideways} Är för abort \end{sideways} &
 
222
        \begin{sideways} Är för kvinnors rättigheter \end{sideways} &
 
223
        \begin{sideways} Är för dödsstraff \end{sideways}
 
224
        \\ \hline
 
225
        Tror på gud(ar) &  & 11 & 7 & 16 & 4 & 17 & 17 & 1
 
226
        \\ \hline
 
227
        Tror på spöken & 11 &  & 5 & 13 & 6 & 17 & 18 & 2
 
228
        \\ \hline
 
229
        Är religös & 7 & 5 &  & 6 & 3 & 8 & 8 & 0
 
230
        \\ \hline
 
231
        Är för ett sekulärt sammhälle & 16 & 13 & 6 &  & 6 & 35 & 35 & 2
 
232
        \\ \hline
 
233
        Vegan eller vegitarian & 4 & 6 & 3 & 6 &  & 8 & 9 & 0
 
234
        \\ \hline
 
235
        Är för abort & 17 & 17 & 8 & 35 & 8 &  & 42 & 4
 
236
        \\ \hline
 
237
        Är för kvinnorsrättigheter & 17 & 18 & 8 & 35 & 9 & 42 &  & 4
 
238
        \\ \hline
 
239
        Är för dödsstraff & 1 & 2 & 0 & 2 & 0 & 4 & 4 & 
 
240
        \\ \hline \hline
 
241
        av totalt & 18 & 19 & 9 & 35 & 9 & 42 & 43 & 4
 
242
        \\ \hline
 
243
      \end{tabular}
 
244
      \caption{Ett litet urval av datan}
 
245
      \label{table:LitetUrval}
 
246
    \end{table}
 
247
  \end{center}
 
248
  
 
249
  Datan I tabellen är framställd via at använda \texttt{count} funktionen i
 
250
  programmet under \texttt{showDB}. Ett exempel på hur man kan göra:
 
251
  \texttt{(cmd) count vegan and dodsstraff} detta skriverut siffran \texttt{0}
 
252
  på kommandopronten.
 
253
  
 
254
  Här kommer en tabell med procentsattser som är producerade genom
 
255
  \begin{math} \frac{cell}{tot_x} \end{math} och
 
256
  \begin{math} \frac{cell}{tot_y} \end{math}.
 
257
  See tabbell \ref{table:ProcentLitetUrval} på sidan
 
258
  \pageref{table:ProcentLitetUrval}.
 
259
  
 
260
  \begin{center}
 
261
    \begin{table}
 
262
      \centering
 
263
      \small
 
264
      \begin{tabular}{ c | c | c | c | c | c | c | c | c | c |}
 
265
        &
 
266
        \begin{sideways} Tror på gu(ar) \end{sideways} &
 
267
        \begin{sideways} Tror på spöken \end{sideways} &
 
268
        \begin{sideways} Är religös \end{sideways} &
 
269
        \begin{sideways} Är för ett sekulärt sammhälle \ \end{sideways} &
 
270
        \begin{sideways} Vegan eller vegitarian \end{sideways} &
 
271
        \begin{sideways} Är för abort \end{sideways} &
 
272
        \begin{sideways} Är för kvinnors rättigheter \end{sideways} &
 
273
        \begin{sideways} Är för dödsstraff \end{sideways}
 
274
        \\ \hline
 
275
         Tror på gud(ar) & x & 61\% & 38\% & 89\% & 22\% & 94\% & 94\% & 5,5\%
 
276
        \\ \hline
 
277
        Tror på spöken & 61\% & x & 28\% & 68\% & 33\% & 89\% & 95\% & 11\%
 
278
        \\ \hline
 
279
        Är religös & 38\% & 28\% & x & 66\% & 33\% & 89\% & 89\% & 0\%
 
280
        \\ \hline
 
281
        Är för ett sekulärt sammhälle & 89\% & 68\% & 66\% & x & 17\% & 100\% &
 
282
        100\% & 5\%
 
283
        \\ \hline
 
284
        Vegan eller vegitarian & 22\% & 33\% & 33\% & 17\% & x & 89\% & 100\% &
 
285
        0\%
 
286
        \\ \hline
 
287
        Är för abort & 94\% & 89\% & 89\% & 100\% & 89\% & x & 100\% & 10\%
 
288
        \\ \hline
 
289
        Är för kvinnorsrättigheter & 94\% & 95\% & 89\%  & 100\% & 0\% & 100\% &
 
290
        x & 9\%
 
291
        \\ \hline
 
292
        Är för dödsstraff & 5,5\% & 11\% & 0\% & 5\% & 0\% & 10\% & 9\% & x
 
293
        \\ \hline \hline
 
294
        av totalt 
 
295
        & \begin{sideways} 100\%/18  \end{sideways}
 
296
        & \begin{sideways} 100\%/19  \end{sideways}
 
297
        & \begin{sideways} 100\%/9   \end{sideways}
 
298
        & \begin{sideways} 100\%/35  \end{sideways}
 
299
        & \begin{sideways} 100\%/9   \end{sideways}
 
300
        & \begin{sideways} 100\%/42  \end{sideways}
 
301
        & \begin{sideways} 100\%/43  \end{sideways}
 
302
        & \begin{sideways} 100\%/4   \end{sideways}
 
303
        \\ \hline
 
304
      \end{tabular}
 
305
      \caption[Procent: Ett urval av datan]{samma data som i tabell
 
306
      \ref{table:LitetUrval} fast i procent.}
 
307
      \label{table:ProcentLitetUrval}
 
308
    \end{table}
 
309
  \end{center}
 
310
  
 
311
  Utifrån datan så har jag sammanställt datan i ett diagram, som visar olika
 
312
  kollomner som har summerats, se figur \ref{graph:summaavkollomener} på sidan
 
313
  \pageref{graph:summaavkollomener}. alla ettiketer är inte med i diagrammet,
 
314
  så här kommer ettiketerna i samma ordning: 
 
315
  \begin{verbatim}
 
316
  gudar, spoken, religos, sekulart, vegan, mars, globaluppvarmning,
 
317
  manen, motion, sund, deprimerad_host, sno, oppet,dodsstraff,
 
318
  kvinnors_rattigheter, abort, kvinnors_kropp, deprimerad_var,
 
319
  vetenskap, evolutionen, gast_sverige, fodd_sverige,
 
320
  foraldrar_sverige, komentarer
 
321
  \end{verbatim}
 
322
  
 
323
  \begin{figure}
 
324
    \centering
 
325
    \caption[Summa av frågeställningar.]{En figur som visar summan av de olika
 
326
    frågeställningarn.}
 
327
    \includegraphics{Graph_summa_av_kollomner.eps}
 
328
    \label{graph:summaavkollomener}
 
329
  \end{figure}
 
330
  
 
331
  \section{Analys av datan och jämförelse med annan statistik}
 
332
  bla bla bla bla bla bla....
 
333
  
 
334
  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
335
  \pagebreak
 
336
  \part{Förtäkningar}
 
337
  
 
338
  \listoffigures
 
339
  
 
340
  \listoftables
 
341
  
 
342
  \printbibliography
 
343
\end{document}