/+junk/Dataanalys

To get this branch, use:
bzr branch http://gegoxaren.bato24.eu/bzr/%2Bjunk/Dataanalys
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
\documentclass{article}

\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage[swedish]{babel}
\usepackage{rotating}

\usepackage[sorting=none]{biblatex}
\bibliography{bibogrophy}

\title{Projektarbete: Dataanalys}
\author{Gustav Hartvigsson \\
Grebbestads Folkhögskola (VT 2011) \\
gustav.hartvigsson@gamil.com}

\begin{document}
  \maketitle
  
  \pagebreak
  
  \tableofcontents
  
  \pagebreak
  
  \part{Intro}
  \section{Projektets syfte}
  Syftet som jag hadde I projektplanen var följande:
  \begin{quote}
    Att träna på dataanalys/lära sig hur man gör dataanalys.
  \end{quote}
  
  En längre beskrinving kunde vara: \emph{Att träna på dataanalys/lära sig hur
  datanalys går till och se på olika metoder för att göra detta på.}
  %FIXME
  
  \section{Frågeställning}
  Frågeställningen som jag hadde i projektplanen är följaned:
  \begin{quote}
    Se hur relationen mellan olika frågeställningar ser ut.
  \end{quote}
  
  En längre och mer utförlig frågeställning skulla kunna vara: \emph {Se hur
  relationen mellan olika svar är. Se tillexempel hur många veganer som är
  för dödsstraff.}
  %FIXME
  
  \section{Metod}
  Metoden beskrev jag i projektpalen är som följande:
  \begin{quote}
    Skriva en enkät med olika frågor som besvaras med kryssrutor.
    
    Sedan stoppa in svaren i ett kalkylblad alt. en databas. där man kan göra
    förfrågningar (querys) och skapa sig en bild av de olika grupperna på
    skolan.
  \end{quote}
  
  Jag är ganska nöjd med med hur den är formuleringen. så jag anser inte att jag
  behöver ändra den.
  
  \section{Presentation}
  Jag hadde en presentation 2011 02 02, denna presentation skrevs i \LaTeX
  \cite{latex.org:main} \cite{LaTeXWiki} och Beamer.
  
  I Projektplanen skev jag följande:
  \begin{quote}
    Göra en presentation som redogör för relationerna mellan olika svar.
    Även eventuellt göra ett program som kan göra querys på ett enkelt sätt.
    
    Jag har tänkt att skriva presentationen i \LaTeX \ och visa upp programmet
    som jag skrev.
  \end{quote}
  
  I den här rapporten tänkte jag framföra lite statestik som visar olika
  fågeställningar och deras relationer till varandra.
  
  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  \part{main}
  \section{varför jag valde de tekniker som jag gjorde}
  
  \subsection{Programmet}
  När jag tänkte på hur jag skulle lösa problemet kom jag att tänka på att det
  vore lätt att ha all data i en sqldatabas och sedan använda sql förfrågningar
  för att ta ut relationerna och räkna instanserna där det är sant.
  
  Sedan behövde jag ett lätt använt språk att skriva en ``front-end'' i som jag
  skulle kunna använda den för att lägga in data och ta ut data med. Med dessa
  kriterier så blev valet Python 3.X \cite{Python.org:main} (även känt som
  python py3k eller Python3k) detta blev dock ett problem, mer om detta i
  sectionen ``Problem'' längre ner.
  
  När det gäller valet av databas så var det inte så svårt, jag har arbetat med
  SQLite förut och kräver inte en bakänsserver som jag skulle behöva använda
  om ja hadde valt tillexempel MySql \cite{MySqlWiki} eller PostgreSql
  \cite{PostgreSqlWiki}.
  
  \subsection{Enkäten}
  Enkäten skrev jag i klartext, dvs oformaterad och med bara stanard tecken för
  att det skulla vara lätt att använda i Bazaar (se längre ner). och att det
  skulle vara lätt att redegera.
  
  enkätens struktur är som följande:
  \begin{verbatim}
Först kom en kort beskrivning av projectet

sedan en liten information om hur datan skulle användas

sedan frågorna:

Fråga 1:
    Tror du på en/flera personlig(a) gud/gudar?
    Ja [ ] Nej [ ]

ect ect.....
  \end{verbatim}
  
  \subsection{Bazaar}
  Jag använde Bazaar (även känt som bzr) som ett revitions kontroll system (RCV)
  för att hålla koll på koden och som ett slags av dagbok över ändringar jag har
  gjort.
  
  här kommer en beskrivning om vad Bazaar är för något frän Bazaars hemside:
  \begin{quote}
    Bazaar is a version control system that helps you track project history over
    time and to collaborate easily with others. Whether you're a single
    developer, a co-located team or a community of developers scattered across
    the world, Bazaar scales and adapts to meet your needs. Part of the GNU
    Project, Bazaar is free software sponsored by Canonical.
    \cite{bazaar:com:main}
  \end{quote}
  
  \section{Problem}
  
  När jag började på projektet hadde jag en idé om att det skulle vara lätt att
  produsera en enkär och sammanställa det i en databas, men värkligheten var
  inte så lätt. I den här sektionen kommer jag att berätta om de problem jag har
  haft under projektets gång.
  
  \subsection{Programmet}
  Jag hadde lite problem när jag gjorde progremmet som jag gjorde, här kommer
  lite exempel på det som jag träffadepå.
  
  \subsubsection{Bibliotek}
  När jag valde Python visste jag att det fanns mängder av bibliotek som kunde
  användas för att att gita grafer i, men jag tänkte inte på att de inte fanns
  i Python 3k. Detta resulterade i att jag inte kunde göra grafer i pogramet som
  jag skerv. jag gjorde en ``utflyckt'' i konsten att porta från ett py2.x till
  py3k (se \cite{LP:GH:PGCP3k}), men jag lade ner det effter som att jag inte
  förstod hur bibleoteket fungerade. Det ända jag gjorde var en enkel portning
  så, trotts att den var användbbar, hadde den inte alla funktioner som
  orginalet hadde.
  
  \subsubsection{debugning}
  Jag utförde aldrig någon ordentlig debuging innan jag försökte lägga in
  svaren i databasen, detta resulterade I att programmet krachade vid andra
  körningen av ``add to db''. Felet var att jag inte ränsade strängen som jag
  sedan använde för att lägga till data i databasen innan jag började på med att
  lägga till mer data till den.
  
  Detta blev fixat i revition med namnet ``\texttt{
  gustav.hartvigsson@gmail.com- 20110131122114-e6e1z0pl2eadau65 }''
  (se \texttt{bzr glog} eller \texttt{bzr log}). 
  %FIXME:
  %lägg upp koden på LP och referera till den där istället.....?
  
  \subsection{Enkät}
  När det kommer till enkäter så var det lite problem. Bland annat så var inte
  svarsrutorna för fråga 9 inte på samma sida som frågan.
  
  Ett annat problem var att jag stavade fel på frågan 4 och 20, där jag skrev
  \emph{sekelärt} istället för \emph{sekulärt} och \emph{morerna} istället för
  \emph{mordärna}.
  
  Andra problem som var med själva frågeställningen var att vissa inte ville
  svara på med ett klart ja eller nej. Detta var ett problem som jag skulle ha
  förutsätt när jag gjorde frågorna,men det gjorde jag inte.
  
  Ett tredje problem som jag hadde var att vissa inte svarade på vissa frågor.
  Mer om detta längre ner.
  
  \part{data och analys}
  Här kommer jag att skriva om der data analysen gick till och hur jag löste
  vissa problem som uppstod, och eventuellt visa någon fin graf som visar hur
  de olika reationerna ser ut.
  
  \section{rådata}
  Jag fick in 44 svar på enkäten, som nu mera finns i en databas, som jag kommer
  att lägga ut på nätet innom en snar framtid tillsammans med programmet.%FIXME
  
  Så här ser ett stycke av databasen ut i csv format.
  \begin{verbatim}
id,gudar,spoken,religos,sekulart,vegan,mars,globaluppvarmning [...]
1,0,0,0,1,0,1,1,1,0,0,0,1,0,1,1,1,1,0,1,1,0,0,1," "
2,0,0,0,1,0,0,1,1,1,1,1,1,1,0,1,1,1,0,1,1,0,1,1," "
3,0,0,0,0,0,0,1,1,0,1,1,1,1,1,1,1,1,0,1,1,0,1,1," "
4,0,0,0,1,0,1,1,1,1,1,1,0,1,0,1,1,1,0,1,1,0,1,0," "
5,0,0,0,1,0,1,1,1,0,0,0,1,1,0,1,1,1,0,0,0,1,1,0," "
6,1,1,0,1,0,1,1,1,0,1,1,1,1,0,1,1,1,0,1,1,0,1,0," Du skull [...]
  \end{verbatim}
  Se \texttt{csv/awnsers2.cvs} för datan i csv format %FIXME Länka till datan på LP när den är upplaggd.
  eller \texttt{awnsers.sqlite} för datan i SQLite3 format.
  
  Datans struktur är inte så märkvärdig: 1 är sannt och 0 är falskt.
  
  \section{tabeller och grafer.}
  
  I den här sektienen kommer jag att gå genom lite statestik äver vilka
  kopplingar som finns mellan olika frågeställningar som var med i enkäten.
  
  \begin{center}
    \begin{table}[h!]
      \begin{tabular}{ c | c | c | c | c | c | c | c | c | c | }
        &
        \begin{sideways} Tror på gu(ar) \end{sideways} &
        \begin{sideways} Tror på spöken \end{sideways} &
        \begin{sideways} Är religös \end{sideways} &
        \begin{sideways} Är för ett sekulärt sammhälle \ \end{sideways} &
        \begin{sideways} Vegan eller vegitarian \end{sideways} &
        \begin{sideways} Är för abort \end{sideways} &
        \begin{sideways} Är för kvinnors rättigheter \end{sideways} &
        \begin{sideways} Är för dödsstraff \end{sideways}
        \\ \hline
        Tror på gud(ar) &  & 11 & 7 & 16 & 4 & 17 & 17 & 1
        \\ \hline
        Tror på spöken & 11 &  & 5 & 13 & 6 & 17 & 18 & 2
        \\ \hline
        Är religös & 7 & 5 &  & 6 & 3 & 8 & 8 & 0
        \\ \hline
        Är för ett sekulärt sammhälle & 16 & 13 & 6 &  & 6 & 35 & 35 & 2
        \\ \hline
        Vegan eller vegitarian & 4 & 6 & 3 & 6 &  & 8 & 9 & 0
        \\ \hline
        Är för abort & 17 & 17 & 8 & 35 & 8 &  & 42 & 4
        \\ \hline
        Är för kvinnorsrättigheter & 17 & 18 & 8 & 35 & 9 & 42 &  & 4
        \\ \hline
        Är för dödsstraff & 1 & 2 & 0 & 2 & 0 & 4 & 4 & 
        \\ \hline \hline
        av totalt & 18 & 19 & 9 & 35 & 9 & 42 & 43 & 4
        \\ \hline
      \end{tabular}
      \caption{Ett litet urval av datan}
      \label{table:LitetUrval}
    \end{table}
  \end{center}
  
  Datan I tabellen är framställd via at använda \texttt{count} funktionen i
  programmet under \texttt{showDB}. Ett exempel på hur man kan göra:
  \texttt{(cmd) count vegan and dodsstraff} detta skriverut siffran \texttt{0}
  på kommandopronten.
  
  Här kommer en tabell med procentsattser som är producerade genom
  \begin{math} \frac{cell}{tot_x} \end{math} och
  \begin{math} \frac{cell}{tot_y} \end{math}
  
  \begin{center}
    \begin{table}
      \small \center
      \begin{tabular}{ c | c | c | c | c | c | c | c | c | c |}
        &
        \begin{sideways} Tror på gu(ar) \end{sideways} &
        \begin{sideways} Tror på spöken \end{sideways} &
        \begin{sideways} Är religös \end{sideways} &
        \begin{sideways} Är för ett sekulärt sammhälle \ \end{sideways} &
        \begin{sideways} Vegan eller vegitarian \end{sideways} &
        \begin{sideways} Är för abort \end{sideways} &
        \begin{sideways} Är för kvinnors rättigheter \end{sideways} &
        \begin{sideways} Är för dödsstraff \end{sideways}
        \\ \hline
         Tror på gud(ar) & x & 61\% & 38\% & 89\% & 22\% & 94\% & 94\% & 5,5\%
        \\ \hline
        Tror på spöken & 61\% & x & 28\% & 68\% & 33\% & 89\% & 95\% & 11\%
        \\ \hline
        Är religös & 38\% & 28\% & x & 66\% & 33\% & 89\% & 89\% & 0\%
        \\ \hline
        Är för ett sekulärt sammhälle & 89\% & 68\% & 66\% & x & 17\% & 100\% &
        100\% & 5\%
        \\ \hline
        Vegan eller vegitarian & 22\% & 33\% & 33\% & 17\% & x & 89\% & 100\% &
        0\%
        \\ \hline
        Är för abort & 94\% & 89\% & 89\% & 100\% & 89\% & x & 100\% & 10\%
        \\ \hline
        Är för kvinnorsrättigheter & 94\% & 95\% & 89\%  & 100\% & 0\% & 100\% &
        x & 9\%
        \\ \hline
        Är för dödsstraff & 5,5\% & 11\% & 0\% & 5\% & 0\% & 10\% & 9\% & x
        \\ \hline \hline
        av totalt 
        & \begin{sideways} 100\%/18  \end{sideways}
        & \begin{sideways} 100\%/19  \end{sideways}
        & \begin{sideways} 100\%/9   \end{sideways}
        & \begin{sideways} 100\%/35  \end{sideways}
        & \begin{sideways} 100\%/9   \end{sideways}
        & \begin{sideways} 100\%/42  \end{sideways}
        & \begin{sideways} 100\%/43  \end{sideways}
        & \begin{sideways} 100\%/4   \end{sideways}
        \\ \hline
      \end{tabular}
      \caption[Procent: Ett urval av datan]{samma data som i tabell
      \ref{table:LitetUrval} fast i procent.}
      \label{table:ProcentLitetUrval}
    \end{table}
  \end{center}
  
  %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  \pagebreak
  \part{Förtäkningar}
  
  \listoffigures
  
  \listoftables
  
  \printbibliography
\end{document}