rt_benchs.git
7 years agoAdd copyright/license information master
Thomas Preud'homme [Mon, 22 Apr 2013 16:30:08 +0000 (18:30 +0200)]
Add copyright/license information

7 years agoFix process_stage comment in pipeline_template
Thomas Preud'homme [Wed, 17 Apr 2013 16:04:46 +0000 (18:04 +0200)]
Fix process_stage comment in pipeline_template

Use consistently E_{} notation to denote the computation done at a given
stage instead of a mix of Stage_{} and E_{}.

8 years ago[pipepar] Update Makefile to template changes
Thomas Preud'homme [Fri, 21 Sep 2012 08:54:08 +0000 (10:54 +0200)]
[pipepar] Update Makefile to template changes

Adapt Makefile after the last commit to measure the speedup instead of
trying several values for parameters in order to configure the
pipeline_template benchmark.

8 years ago[pipepar] Default to speedup bench for template
Thomas Preud'homme [Fri, 7 Sep 2012 14:47:18 +0000 (16:47 +0200)]
[pipepar] Default to speedup bench for template

Change default mode from stage time measurement to speedup measurement.

Previously, each stage featured a sleep whose length is proportional to
a fixed total time divided by the number of cores involve in the
computation multiplied to the number of packets handled in order to
measure the length in time of one stage. That is, for a number of core
nc, a number of packets np and a total time T, the time spent to sleep
was t=T/(nc*np). By fixing both the number of cores and the total time,
it was thus possible to measure the time needed to deal with one packets
in one stage.

Now, the default mode is to not do any sleep and thus have a computation
whose complexity is inversely proportional to the number of cores. By
varying the number of cores, it is thus possible to measure the speedup.

8 years ago[pipepar] Compute a CRC 8bit in lattice.c
Thomas Preud'homme [Fri, 7 Sep 2012 09:57:27 +0000 (11:57 +0200)]
[pipepar] Compute a CRC 8bit in lattice.c

* Change number of bits in CRC to 8
* Avoid q to be higher than 2^CRC_BIT
* Increase the number of packets when benchmarking lattice.c

8 years ago[pipepar] Avoid output when using "script"
Thomas Preud'homme [Tue, 4 Sep 2012 18:02:58 +0000 (20:02 +0200)]
[pipepar] Avoid output when using "script"

Call script with -q to avoid any output

8 years ago[pipepar] Fix pragma for 12 cores in pipeline_template
Thomas Preud'homme [Tue, 4 Sep 2012 18:00:29 +0000 (20:00 +0200)]
[pipepar] Fix pragma for 12 cores in pipeline_template

Add state10 to the list of private variable in the last pragma in the
case of 12 cores in pipeline_template computation.

8 years ago[pipepar] Allocate variable statically in lattice
Thomas Preud'homme [Tue, 4 Sep 2012 17:58:26 +0000 (19:58 +0200)]
[pipepar] Allocate variable statically in lattice

Not sure declarations leads to real allocation anyway (it should be done
according to the pragmas instead) but just in case, move the declaration
of variables in main so that they are statically allocated.

8 years ago[pipepar] Improve log readability for lattice
Thomas Preud'homme [Tue, 4 Sep 2012 17:56:44 +0000 (19:56 +0200)]
[pipepar] Improve log readability for lattice

Delimit beginning and end of one lattice computation in order to easily
check the logs.

8 years ago[pipepar] Reduce number of log in lattice.c
Thomas Preud'homme [Tue, 4 Sep 2012 17:54:07 +0000 (19:54 +0200)]
[pipepar] Reduce number of log in lattice.c

Only print a probability for a few possible CRC of the last packet in
order to reduce the number of logs. This allows the program to be run
through ssh and to easily check wether the result is correct or not.

8 years ago[pipepar] Explicit cast in compute_cumulative_metrics_column
Thomas Preud'homme [Tue, 4 Sep 2012 17:51:07 +0000 (19:51 +0200)]
[pipepar] Explicit cast in compute_cumulative_metrics_column

Explicit the cast for loop variable from uint_fast32_t to uint_fast16_t

8 years ago[pipepar] Improve benchmark run
Thomas Preud'homme [Mon, 3 Sep 2012 09:47:26 +0000 (11:47 +0200)]
[pipepar] Improve benchmark run

* Ensure benchmarks run with warm cache
* Run benchmarks 10 times
* Log benchmarks
* Factorize code by using macro

8 years ago[commtech] Detect if perf supports -o switch
Thomas Preud'homme [Sat, 7 Jul 2012 21:43:30 +0000 (23:43 +0200)]
[commtech] Detect if perf supports -o switch

Use script in the case where perf doesn't support -o switch (old perf
version)

8 years ago[commtech] Also compile gomp_stream_64_comm
Thomas Preud'homme [Sat, 7 Jul 2012 21:29:11 +0000 (23:29 +0200)]
[commtech] Also compile gomp_stream_64_comm

Add gomp_stream_64_comm to the least of communication techniques to
compile.

8 years ago[commtech] Fixes in gomp_stream
Thomas Preud'homme [Sat, 7 Jul 2012 21:26:24 +0000 (23:26 +0200)]
[commtech] Fixes in gomp_stream

* Stick to the sizes used in gomp_stream
* Release data when they are *all* received

8 years agoMerge branch 'bqv2_buf_end'
Thomas Preud'homme [Sat, 7 Jul 2012 21:14:15 +0000 (23:14 +0200)]
Merge branch 'bqv2_buf_end'

8 years ago[commtech] Use only 1 thread per core
Thomas Preud'homme [Sat, 7 Jul 2012 20:58:49 +0000 (22:58 +0200)]
[commtech] Use only 1 thread per core

Creating 2 thread per core in the purpose of receiving while sending is
plain stupid. First it needs 2 threads synchronizing with each other
which has a cost. Second, since only one thread can run at a time the
threads slow each other (using BatchQueue where the sender is on the
same core as the receiver yields bad performance). This patch remove all
this complexity to have one thread receive, compute and then resend
data, which improve performances dramatically.

8 years agoAdd CSQ (2/1) and CSQ (2/32), Del CSQ (2/2)
Thomas Preud'homme [Mon, 26 Mar 2012 22:31:16 +0000 (00:31 +0200)]
Add CSQ (2/1) and CSQ (2/32), Del CSQ (2/2)

8 years ago[commtech] Provide 64 cache lines version of algos
Thomas Preud'homme [Mon, 26 Mar 2012 14:44:30 +0000 (16:44 +0200)]
[commtech] Provide 64 cache lines version of algos

* Provide for BatchQueue, CSQ, FastForward, MCRingBuffer and GOMP stream
  a version using 64 cache lines in total for all buffers.
* Rename common version from _common_comm.h to _common.h to avoid
  considering them as communication technique on their own

8 years ago[commtech] Initialize vector in calc_mat.c
Thomas Preud'homme [Mon, 26 Mar 2012 14:14:23 +0000 (16:14 +0200)]
[commtech] Initialize vector in calc_mat.c

8 years agoparsing.sh: Remove assumption about calc args
Thomas Preud'homme [Mon, 26 Mar 2012 14:07:50 +0000 (16:07 +0200)]
parsing.sh: Remove assumption about calc args

Calc can have several args for useless_loop and line prods and for comm
and barriere bench. Hence:

* Change use_histo to reflect that
* Set list of args per bench/prod instead of globally
* No need for the argument (since there is several) in create_complex_dat_body

8 years agoparsing.sh Remove a few assumptions
Thomas Preud'homme [Mon, 26 Mar 2012 14:04:31 +0000 (16:04 +0200)]
parsing.sh Remove a few assumptions

Remove assumptions around barriere bench:
* Not always 2 memory hierarchy are tested -> numCacheConfigs
* barriereList -> ${bench}List
* Size of the calc argument -> *

8 years agoparsing.sh: support batch_queue_* for barriere
Thomas Preud'homme [Mon, 26 Mar 2012 11:20:18 +0000 (13:20 +0200)]
parsing.sh: support batch_queue_* for barriere

Count batch_queue_* in barriere bench

8 years ago[commtech] Add missing .c for new CSQ configs
Thomas Preud'homme [Tue, 20 Mar 2012 11:16:10 +0000 (12:16 +0100)]
[commtech] Add missing .c for new CSQ configs

8 years ago[commtech] Add the new configs for compilation
Thomas Preud'homme [Tue, 20 Mar 2012 11:05:12 +0000 (12:05 +0100)]
[commtech] Add the new configs for compilation

8 years ago[commtech] Provide more CSQ configs
Thomas Preud'homme [Tue, 20 Mar 2012 10:07:05 +0000 (11:07 +0100)]
[commtech] Provide more CSQ configs

* Rename CSQ configs to csq_<nbr_buffers>_<size_buffer>_comm.h
* Add several configs
* Default config is csq_comm.h

8 years agoRevert junk from "Fix including perf stat in logs"
Thomas Preud'homme [Tue, 20 Mar 2012 09:38:00 +0000 (10:38 +0100)]
Revert junk from "Fix including perf stat in logs"

This partially reverts commit 65a2ed9357f708b64cf1b5ae65ca09f14a686de7.
It removes all the changes in the configuration variable at the top of
the file which were not supposed to be commited.

8 years agoRemove useless .main.d file
Thomas Preud'homme [Mon, 19 Mar 2012 19:40:24 +0000 (20:40 +0100)]
Remove useless .main.d file

8 years agoCSQ's article suggest SUB_SLOTS should be 64.
Thomas Preud'homme [Wed, 14 Mar 2012 17:41:51 +0000 (18:41 +0100)]
CSQ's article suggest SUB_SLOTS should be 64.

8 years agoFix including perf stat in logs
Thomas Preud'homme [Wed, 14 Mar 2012 11:46:47 +0000 (12:46 +0100)]
Fix including perf stat in logs

This commit fix commit b0441d7a1cf306521d76b3384d6435ed5d1dcaae

8 years agoAutomate test of pipeline_template
Thomas Preud'homme [Wed, 1 Feb 2012 19:08:31 +0000 (20:08 +0100)]
Automate test of pipeline_template

8 years agoSupport NB_CORES between 1 and 12 out of the box
Thomas Preud'homme [Wed, 1 Feb 2012 18:10:54 +0000 (19:10 +0100)]
Support NB_CORES between 1 and 12 out of the box

Prepare an "omp parallel" pragma for NB_CORES between 2 and 12. This
avoid needing any change in the file for NB_CORES between 1 and 12.

8 years agoRemove debugging printf
Thomas Preud'homme [Wed, 1 Feb 2012 18:06:46 +0000 (19:06 +0100)]
Remove debugging printf

8 years agoCheck the result of the computation
Thomas Preud'homme [Wed, 1 Feb 2012 17:57:24 +0000 (18:57 +0100)]
Check the result of the computation

Make sure the result of the computation is always the same

8 years agoStage time can be made smaller
Thomas Preud'homme [Wed, 1 Feb 2012 17:47:50 +0000 (18:47 +0100)]
Stage time can be made smaller

Allow stage time to be smaller by adjusting after the computing was done
instead of before.

8 years agoAllow automatic test run for lattice
Thomas Preud'homme [Wed, 1 Feb 2012 17:18:06 +0000 (18:18 +0100)]
Allow automatic test run for lattice

8 years agoAdd the never run lattice.cpp
Thomas Preud'homme [Tue, 31 Jan 2012 16:39:41 +0000 (17:39 +0100)]
Add the never run lattice.cpp

Add the never run lattice.cpp from upon lattice.c is based.

8 years agoUpdate .gitignore
Thomas Preud'homme [Tue, 31 Jan 2012 16:37:26 +0000 (17:37 +0100)]
Update .gitignore

8 years agoRemove fmr_omp-str_base
Thomas Preud'homme [Tue, 31 Jan 2012 16:28:52 +0000 (17:28 +0100)]
Remove fmr_omp-str_base

Stop worrying about keeping bit identical fmr_omp-str_base

8 years agoUpdate Makefile for fmr_omp-str_base generation
Thomas Preud'homme [Tue, 31 Jan 2012 16:27:39 +0000 (17:27 +0100)]
Update Makefile for fmr_omp-str_base generation

8 years agoAdd template of pipeline parallelism friendly code
Thomas Preud'homme [Sun, 8 Jan 2012 19:07:41 +0000 (20:07 +0100)]
Add template of pipeline parallelism friendly code

pipeline_template.c is an example of a pipeline parallelism friendly code in the
sense that it can't be parallelized by any other known parallelization technique.

8 years agoAdd pipeline computation of lattice
Thomas Preud'homme [Tue, 6 Dec 2011 17:24:19 +0000 (18:24 +0100)]
Add pipeline computation of lattice

8 years agoRemove addition of $HOME/local/bin to the PATH
Thomas Preud'homme [Tue, 6 Dec 2011 17:19:51 +0000 (18:19 +0100)]
Remove addition of $HOME/local/bin to the PATH

Remove addition of $HOME/local/bin to the PATH since it's already in the PATH now

8 years agoRevert "Add an implementation to compute n'th digit of pi"
Thomas Preud'homme [Tue, 6 Dec 2011 17:17:31 +0000 (18:17 +0100)]
Revert "Add an implementation to compute n'th digit of pi"

This reverts commit f480a5e3c2dd2bc23422c6a1c0acea9b3df428c2.

8 years agoAdd an implementation to compute n'th digit of pi
Thomas Preud'homme [Wed, 9 Nov 2011 14:55:12 +0000 (15:55 +0100)]
Add an implementation to compute n'th digit of pi

8 years agoAdd a less naïve script to compare BatchQueue to GOMP native
Thomas Preud'homme [Wed, 2 Nov 2011 18:35:32 +0000 (19:35 +0100)]
Add a less naïve script to compare BatchQueue to GOMP native
communication library *and* to sequential code by performing a
more useful computation.

8 years agoAdd a simple test to try automatic usage of BatchQueue through OpenMP
Thomas Preud'homme [Wed, 2 Nov 2011 18:34:41 +0000 (19:34 +0100)]
Add a simple test to try automatic usage of BatchQueue through OpenMP

8 years agoMake the script work with GOMP_stream* and GOMP_batchQ* functions
Thomas Preud'homme [Wed, 2 Nov 2011 18:32:56 +0000 (19:32 +0100)]
Make the script work with GOMP_stream* and GOMP_batchQ* functions

8 years agoUse CFLAGS in Makefile
Thomas Preud'homme [Fri, 2 Sep 2011 10:52:07 +0000 (12:52 +0200)]
Use CFLAGS in Makefile

8 years agoMakefile to compile 'n patch FMradio w/ BatchQueue
Thomas Preud'homme [Fri, 5 Aug 2011 14:05:01 +0000 (16:05 +0200)]
Makefile to compile 'n patch FMradio w/ BatchQueue

8 years agoAdd display_streams script
Thomas Preud'homme [Fri, 5 Aug 2011 13:57:55 +0000 (15:57 +0200)]
Add display_streams script

display_streams is able to:
+ display the structure of streams
+ display stats about commits and updates

8 years agoCommit the script to setup the environment
Thomas Preud'homme [Fri, 5 Aug 2011 13:35:04 +0000 (15:35 +0200)]
Commit the script to setup the environment

Commit setup_environment which sets up the PATH and LD_LIBRARY_PATH to
find the toolchain (modified gcc) and libraries (openmp).

8 years agoInitial release of FMradio
Thomas Preud'homme [Fri, 5 Aug 2011 13:33:29 +0000 (15:33 +0200)]
Initial release of FMradio

* Source file for FMradio with (i) openmp stream extension and (ii)
  openmp stream and data parallelism extensions.
* Input files (small and larger one) to test FMradio.
* Compiled version of FMradio just in case of any later problem in the
  toolchain (although the toolchain itself is saved in git).

8 years agolancement.sh: Unset verbose mode
Thomas Preud'homme [Tue, 21 Feb 2012 17:07:12 +0000 (18:07 +0100)]
lancement.sh: Unset verbose mode

8 years agolancement.sh: Send data in group
Thomas Preud'homme [Tue, 21 Feb 2012 17:06:47 +0000 (18:06 +0100)]
lancement.sh: Send data in group

8 years agolancement.sh: Include perf stats in log files
Thomas Preud'homme [Tue, 21 Feb 2012 17:05:59 +0000 (18:05 +0100)]
lancement.sh: Include perf stats in log files

8 years agoparsing.sh: Make metric pattern work again
Thomas Preud'homme [Tue, 21 Feb 2012 17:02:40 +0000 (18:02 +0100)]
parsing.sh: Make metric pattern work again

8 years agoparsing.sh: Don't create patternPlotFile.gnuplot
Thomas Preud'homme [Tue, 21 Feb 2012 17:02:17 +0000 (18:02 +0100)]
parsing.sh: Don't create patternPlotFile.gnuplot

8 years agoparsing.sh: Pass all params to create_complex_dat_body
Thomas Preud'homme [Tue, 21 Feb 2012 17:01:46 +0000 (18:01 +0100)]
parsing.sh: Pass all params to create_complex_dat_body

8 years ago[commtech] Simplify if's in send() rebased_bqv2_buf_end
Thomas Preud'homme [Mon, 6 Jun 2011 11:34:01 +0000 (13:34 +0200)]
[commtech] Simplify if's in send()

Test sender_ptr against the end of the current buffer via
channel->sender_ptr_end

8 years ago[commtech] BatchQueue v2
Thomas Preud'homme [Mon, 30 May 2011 14:23:43 +0000 (16:23 +0200)]
[commtech] BatchQueue v2

Uses 2 mapping to the same structure to avoid prefetching of the
producer semi-buffer by the consumer. The idea is to access everything
through mapping 1 except semi-buffer 2 which is accessed through mapping
2.

8 years agoRemove debug informations
Thomas Preud'homme [Mon, 30 Jan 2012 18:42:50 +0000 (19:42 +0100)]
Remove debug informations

8 years agoAdd native algo from OpenMP stream extension
Thomas Preud'homme [Mon, 30 Jan 2012 18:40:50 +0000 (19:40 +0100)]
Add native algo from OpenMP stream extension

Add native algorithm from OpenMP stream extension. This require adding
one function in commtech.h: end_producer(). This function does nothing
for all communication algorithm but gomp_stream (the algorithm added by
this commit).

9 years agoMake all threads are joined
Thomas Preud'homme [Wed, 1 Jun 2011 13:16:49 +0000 (15:16 +0200)]
Make all threads are joined

in join_threads, nb_thread is the id of the last thread, not the number
of threads to join. Hence the for loop must include this id.

9 years agoSINK thread (not INTERM) notify its termination
Thomas Preud'homme [Wed, 1 Jun 2011 13:20:10 +0000 (15:20 +0200)]
SINK thread (not INTERM) notify its termination

Use !!node_param->type & SINK in likely macro to test wether we are a
SINK node or an INTERM node.

9 years agoPropose 2048 and 4096 buffer size for BatchQueue.
Thomas Preud'homme [Fri, 27 May 2011 13:33:02 +0000 (15:33 +0200)]
Propose 2048 and 4096 buffer size for BatchQueue.

9 years ago[commtech] Ensure real and displayed cmdline match
Thomas Preud'homme [Wed, 25 May 2011 13:40:51 +0000 (15:40 +0200)]
[commtech] Ensure real and displayed cmdline match

9 years agoMerge branch 'improve_pipeline'
Thomas Preud'homme [Fri, 27 May 2011 13:42:11 +0000 (15:42 +0200)]
Merge branch 'improve_pipeline'

9 years agoImprove pipeline (cons and prod in //)
Thomas Preud'homme [Tue, 10 May 2011 11:43:55 +0000 (13:43 +0200)]
Improve pipeline (cons and prod in //)

9 years agoFix MCRingBuffer deadlocks
Thomas Preud'homme [Tue, 10 May 2011 15:19:21 +0000 (17:19 +0200)]
Fix MCRingBuffer deadlocks

* batchSize must be kept in sync with the number of cache line sent.
* Don't ask more data than sent

9 years agoUse multiples of BUF_SIZE when needed
Thomas Preud'homme [Tue, 10 May 2011 09:14:28 +0000 (11:14 +0200)]
Use multiples of BUF_SIZE when needed

Number of cache line sent and size of reception buffer must be a
multiple of BUF_SIZE.

9 years agoFix buffer loop in BatchQueue single data mode
Thomas Preud'homme [Tue, 10 May 2011 09:02:00 +0000 (11:02 +0200)]
Fix buffer loop in BatchQueue single data mode

The buffer in single data mode in batchQueue was not circular because a
variable was not renamed

9 years agoFix option to choose the number of node
Thomas Preud'homme [Mon, 9 May 2011 13:01:06 +0000 (15:01 +0200)]
Fix option to choose the number of node

Option is now in the getopt string and accessible with -l switch.

9 years agoFix bugs coming from refactoring
Thomas Preud'homme [Thu, 5 May 2011 17:54:44 +0000 (19:54 +0200)]
Fix bugs coming from refactoring

9 years agoFix incorrect usage string: --check -> -k
Thomas Preud'homme [Thu, 5 May 2011 12:50:49 +0000 (14:50 +0200)]
Fix incorrect usage string: --check -> -k

9 years ago[commtech] Refactor to chain more than 2 nodes
Thomas Preud'homme [Mon, 11 Apr 2011 14:18:49 +0000 (16:18 +0200)]
[commtech] Refactor to chain more than 2 nodes

* Refactor the source to be able to chain more than 2 nodes together
* Compile all binaries by default (binList must be set manually in
  lancement.sh to run only a subset of the binaries

9 years ago[commtech] Varying size of buffer for BatchQueue
Thomas Preud'homme [Mon, 11 Apr 2011 13:34:49 +0000 (15:34 +0200)]
[commtech] Varying size of buffer for BatchQueue

Create several variation of BatchQueue, each with a different buffer
size: batch_queue_1024, batch_queue_512, ..., batch_queue_2.

9 years agoAdd a "sent words == received words" check
Thomas Preud'homme [Wed, 4 May 2011 17:32:24 +0000 (19:32 +0200)]
Add a "sent words == received words" check

9 years agoSupport log file without "buf size" message
Thomas Preud'homme [Wed, 4 May 2011 17:30:49 +0000 (19:30 +0200)]
Support log file without "buf size" message

Instead of trying to get the buf size in the first log, grep on all logs
and take the value of the first match.

9 years agoResiliant to empty ${bench}List
Thomas Preud'homme [Wed, 4 May 2011 13:27:35 +0000 (15:27 +0200)]
Resiliant to empty ${bench}List

9 years ago[commtech] Prevent prefetch in batch queue
Thomas Preud'homme [Wed, 2 Mar 2011 11:49:09 +0000 (12:49 +0100)]
[commtech] Prevent prefetch in batch queue

Prevent prefetch of state variable in BatchQueue by adding padding
between the buffers and state variable.

9 years ago[commtech] Increase the number of word sent
Thomas Preud'homme [Wed, 2 Mar 2011 11:47:53 +0000 (12:47 +0100)]
[commtech] Increase the number of word sent

9 years ago[commtech] Handle more than 2 cache hierarchies
Thomas Preud'homme [Wed, 2 Mar 2011 11:44:00 +0000 (12:44 +0100)]
[commtech] Handle more than 2 cache hierarchies

Rewrite creation of simple gnuplot to handle more than 2 cache
hierarchies (like L2, CPU and mem for sibling cores on same CPU,
non-sibling cores on same CPU and non sibling cores on different CPU).

9 years ago[commtech] Make BUF_SIZE definition be per tech
Thomas Preud'homme [Wed, 2 Mar 2011 11:20:47 +0000 (12:20 +0100)]
[commtech] Make BUF_SIZE definition be per tech

Don't define BUF_SIZE globally anymore, but per communication technique

9 years ago[commtech] Remove asm_cache from the comm techs
Thomas Preud'homme [Wed, 2 Mar 2011 11:11:22 +0000 (12:11 +0100)]
[commtech] Remove asm_cache from the comm techs

9 years ago[commtech] Rename c_cache to batch_queue
Thomas Preud'homme [Wed, 2 Mar 2011 11:10:48 +0000 (12:10 +0100)]
[commtech] Rename c_cache to batch_queue

9 years agoFix various bugs in log creation and parsing
Thomas Preud'homme [Thu, 24 Feb 2011 19:58:37 +0000 (20:58 +0100)]
Fix various bugs in log creation and parsing

* Force english locales (esp. for numeric values)
* Handle french and english numeric values
* Handle absence of useless_prod log
* Handle unique cache hierarchy

9 years ago[barrier] Make the bench use perf instead of PAPI
Thomas Preud'homme [Sat, 29 Jan 2011 16:51:45 +0000 (17:51 +0100)]
[barrier] Make the bench use perf instead of PAPI

- Convert barrier bench from papi+PapiHighLevel to perf framework
- Remove papihighlevel submodule
- Simplify Makefile (include moving some of the code in a separate
  script)

9 years ago[commtech] Display misses of L1 cache
Thomas Preud'homme [Fri, 28 Jan 2011 22:59:57 +0000 (23:59 +0100)]
[commtech] Display misses of L1 cache

- Remove infos about last level cache
+ Add misses of L1 cache

9 years ago[commtech] Make WORDS_PER_BUF indep of BUF_SIZE.
Thomas Preud'homme [Fri, 28 Jan 2011 03:56:44 +0000 (04:56 +0100)]
[commtech] Make WORDS_PER_BUF indep of BUF_SIZE.

The number of data sent must be independent of the buffer size chosen
by each algorithm.

9 years ago[commtech] Use param variable for matrice calc.
Thomas Preud'homme [Tue, 25 Jan 2011 16:27:07 +0000 (17:27 +0100)]
[commtech] Use param variable for matrice calc.

Matrice calculation library should not take parameter value 16 hardcoded
but use the value of the param variable.

9 years ago[commtech] Fix cache line size
Thomas Preud'homme [Tue, 25 Jan 2011 16:25:38 +0000 (17:25 +0100)]
[commtech] Fix cache line size

Cache line size in current processors (at least the one used for tests:
cerclon) is 64 bytes, not 128. Thus modifying the declaration in
commtech.h

9 years ago[commtech] Add calculation method
Thomas Preud'homme [Tue, 25 Jan 2011 16:21:39 +0000 (17:21 +0100)]
[commtech] Add calculation method

Add a calculation method which add the value of the first integer of
n consecutive cache lines and write the results in one of the integer of
these cache lines. Next calculation uses the next n consecutives cache
lines and write the result in the next integer.

9 years agoSplit CSQ in 2 communication techniques.
Thomas Preud'homme [Tue, 25 Jan 2011 16:09:26 +0000 (17:09 +0100)]
Split CSQ in 2 communication techniques.

* Divide CSQ in 2 communication techniques: one with 2 slots (as in
  BatchQueue aka c_cache) and one with 64 slots (as in the article)
* Rename fake communication technique in none communication technique
  and disable any activity (send no longer does anything)

9 years ago[commtech] CSQ use memcpy in dequeue for fairness
Thomas Preud'homme [Wed, 19 Jan 2011 10:43:52 +0000 (11:43 +0100)]
[commtech] CSQ use memcpy in dequeue for fairness

Paper about CSQ uses memcpy in enqueue and dequeue. Although it is not
possible to use memcpy in enqueue because of current API, it is possible
to use memcpy in dequeue, hence this commit.

9 years ago[commtech] Fix time metric pattern
Thomas Preud'homme [Sun, 16 Jan 2011 16:30:00 +0000 (17:30 +0100)]
[commtech] Fix time metric pattern

time metric pattern need to include dots and several elements as a time
is typically of the form 42.42424242

9 years ago[commtech] Remove pipe_comm to produce 50000000 l
Thomas Preud'homme [Sun, 16 Jan 2011 16:27:21 +0000 (17:27 +0100)]
[commtech] Remove pipe_comm to produce 50000000 l

Multiply by 10 the number of cache line send from the producer to the
consumer to have a more accurate mean. This require excluding pipe_comm
as this bench is way too slow to send so much data.

9 years ago[commtech] Place volatile on the right qualifier.
Thomas Preud'homme [Thu, 13 Jan 2011 13:58:13 +0000 (14:58 +0100)]
[commtech] Place volatile on the right qualifier.

9 years agoRemove obsolete TODO.
Thomas Preud'homme [Mon, 3 Jan 2011 10:40:23 +0000 (11:40 +0100)]
Remove obsolete TODO.

9 years ago[commtech] Fix idx test in c_cache technique.
Thomas Preud'homme [Mon, 3 Jan 2011 10:35:42 +0000 (11:35 +0100)]
[commtech] Fix idx test in c_cache technique.

c_cache watching status value when idx % BUF_SIZE != 0 instead of when
it's equal zero.