5% faster decode_subband()
a little cleanup Originally committed as revision 3420 to svn://svn.ffmpeg.org/ffmpeg/trunk
This commit is contained in:
		
							parent
							
								
									7b49c30974
								
							
						
					
					
						commit
						0cea8a037c
					
				@ -375,6 +375,7 @@ typedef struct SubBand{
 | 
			
		||||
    int qlog;                                   ///< log(qscale)/log[2^(1/6)]
 | 
			
		||||
    DWTELEM *buf;
 | 
			
		||||
    int16_t *x;
 | 
			
		||||
    DWTELEM *coeff;
 | 
			
		||||
    struct SubBand *parent;
 | 
			
		||||
    uint8_t state[/*7*2*/ 7 + 512][32];
 | 
			
		||||
}SubBand;
 | 
			
		||||
@ -1903,92 +1904,7 @@ static inline void decode_subband(SnowContext *s, SubBand *b, DWTELEM *src, DWTE
 | 
			
		||||
    int x,y;
 | 
			
		||||
 | 
			
		||||
    START_TIMER
 | 
			
		||||
#if 0    
 | 
			
		||||
    for(y=0; y<b->height; y++)
 | 
			
		||||
        memset(&src[y*stride], 0, b->width*sizeof(DWTELEM));
 | 
			
		||||
 | 
			
		||||
    int plane;
 | 
			
		||||
    for(plane=24; plane>=0; plane--){
 | 
			
		||||
        int run;
 | 
			
		||||
 | 
			
		||||
        run= get_symbol(&s->c, b->state[1], 0);
 | 
			
		||||
                
 | 
			
		||||
#define HIDE(c, plane) c= c>=0 ? c&((-1)<<(plane)) : -((-c)&((-1)<<(plane)));
 | 
			
		||||
        
 | 
			
		||||
        for(y=0; y<h; y++){
 | 
			
		||||
            for(x=0; x<w; x++){
 | 
			
		||||
                int v, p=0, lv;
 | 
			
		||||
                int /*ll=0, */l=0, lt=0, t=0, rt=0;
 | 
			
		||||
                int d=0, r=0, rd=0, ld=0;
 | 
			
		||||
                lv= src[x + y*stride];
 | 
			
		||||
 | 
			
		||||
                if(y){
 | 
			
		||||
                    t= src[x + (y-1)*stride];
 | 
			
		||||
                    if(x){
 | 
			
		||||
                        lt= src[x - 1 + (y-1)*stride];
 | 
			
		||||
                    }
 | 
			
		||||
                    if(x + 1 < w){
 | 
			
		||||
                        rt= src[x + 1 + (y-1)*stride];
 | 
			
		||||
                    }
 | 
			
		||||
                }
 | 
			
		||||
                if(x){
 | 
			
		||||
                    l= src[x - 1 + y*stride];
 | 
			
		||||
                    /*if(x > 1){
 | 
			
		||||
                        if(orientation==1) ll= src[y + (x-2)*stride];
 | 
			
		||||
                        else               ll= src[x - 2 + y*stride];
 | 
			
		||||
                    }*/
 | 
			
		||||
                }
 | 
			
		||||
                if(y+1<h){
 | 
			
		||||
                    d= src[x + (y+1)*stride];
 | 
			
		||||
                    if(x)         ld= src[x - 1 + (y+1)*stride];
 | 
			
		||||
                    if(x + 1 < w) rd= src[x + 1 + (y+1)*stride];
 | 
			
		||||
                }
 | 
			
		||||
                if(x + 1 < w)
 | 
			
		||||
                    r= src[x + 1 + y*stride];
 | 
			
		||||
 | 
			
		||||
                if(parent){
 | 
			
		||||
                    int px= x>>1;
 | 
			
		||||
                    int py= y>>1;
 | 
			
		||||
                    if(px<b->parent->width && py<b->parent->height) 
 | 
			
		||||
                        p= parent[px + py*2*stride];
 | 
			
		||||
                }
 | 
			
		||||
                HIDE( p, plane)
 | 
			
		||||
                if(/*ll|*/l|lt|t|rt|r|rd|ld|d|p|lv){
 | 
			
		||||
                    int context= av_log2(/*ABS(ll) + */3*ABS(l) + ABS(lt) + 2*ABS(t) + ABS(rt) + ABS(p)
 | 
			
		||||
                                                      +3*ABS(r) + ABS(rd) + 2*ABS(d) + ABS(ld));
 | 
			
		||||
 | 
			
		||||
                    if(lv){
 | 
			
		||||
                        assert(context + 8*av_log2(ABS(lv)) < 512 - 100);
 | 
			
		||||
                        if(get_cabac(&s->c, &b->state[99][context + 8*(av_log2(ABS(lv))-plane)])){
 | 
			
		||||
                            if(lv<0) v= lv - (1<<plane);
 | 
			
		||||
                            else     v= lv + (1<<plane);
 | 
			
		||||
                        }else
 | 
			
		||||
                            v=lv;
 | 
			
		||||
                    }else{
 | 
			
		||||
                        v= get_cabac(&s->c, &b->state[ 0][context]) << plane;
 | 
			
		||||
                    }
 | 
			
		||||
                }else{
 | 
			
		||||
                    assert(!lv);
 | 
			
		||||
                    if(!run){
 | 
			
		||||
                        run= get_symbol(&s->c, b->state[1], 0);
 | 
			
		||||
                        v= 1<<plane;
 | 
			
		||||
                    }else{
 | 
			
		||||
                        run--;
 | 
			
		||||
                        v=0;
 | 
			
		||||
                    }
 | 
			
		||||
                }
 | 
			
		||||
                if(v && !lv){
 | 
			
		||||
                    int context=    clip(quant3b[l&0xFF] + quant3b[r&0xFF], -1,1)
 | 
			
		||||
                                + 3*clip(quant3b[t&0xFF] + quant3b[d&0xFF], -1,1);
 | 
			
		||||
                    if(get_cabac(&s->c, &b->state[0][16 + 1 + 3 + context]))
 | 
			
		||||
                        v= -v;
 | 
			
		||||
                }
 | 
			
		||||
                src[x + y*stride]= v;
 | 
			
		||||
            }
 | 
			
		||||
        }
 | 
			
		||||
    }
 | 
			
		||||
    return;    
 | 
			
		||||
#endif
 | 
			
		||||
    if(1){
 | 
			
		||||
        int run;
 | 
			
		||||
        int index=0;
 | 
			
		||||
@ -2002,26 +1918,22 @@ static inline void decode_subband(SnowContext *s, SubBand *b, DWTELEM *src, DWTE
 | 
			
		||||
 | 
			
		||||
        run= get_symbol2(&s->c, b->state[1], 3);
 | 
			
		||||
        for(y=0; y<h; y++){
 | 
			
		||||
            for(x=0; x<w; x++){
 | 
			
		||||
                int v, p=0;
 | 
			
		||||
                int /*ll=0, */l=0, lt=0, t=0, rt=0;
 | 
			
		||||
            int v=0;
 | 
			
		||||
            int lt=0, t=0, rt=0;
 | 
			
		||||
 | 
			
		||||
                if(y){
 | 
			
		||||
                    t= src[x + (y-1)*stride];
 | 
			
		||||
                    if(x){
 | 
			
		||||
                        lt= src[x - 1 + (y-1)*stride];
 | 
			
		||||
                    }
 | 
			
		||||
                    if(x + 1 < w){
 | 
			
		||||
                        rt= src[x + 1 + (y-1)*stride];
 | 
			
		||||
                    }
 | 
			
		||||
                }
 | 
			
		||||
                if(x){
 | 
			
		||||
                    l= src[x - 1 + y*stride];
 | 
			
		||||
                    /*if(x > 1){
 | 
			
		||||
                        if(orientation==1) ll= src[y + (x-2)*stride];
 | 
			
		||||
                        else               ll= src[x - 2 + y*stride];
 | 
			
		||||
                    }*/
 | 
			
		||||
                }
 | 
			
		||||
            if(y){
 | 
			
		||||
                rt= src[(y-1)*stride];
 | 
			
		||||
            }
 | 
			
		||||
            for(x=0; x<w; x++){
 | 
			
		||||
                int p=0;
 | 
			
		||||
                const int l= v;
 | 
			
		||||
                
 | 
			
		||||
                lt= t; t= rt;
 | 
			
		||||
 | 
			
		||||
                if(y && x + 1 < w){
 | 
			
		||||
                    rt= src[x + 1 + (y-1)*stride];
 | 
			
		||||
                }else
 | 
			
		||||
                    rt= 0;
 | 
			
		||||
                if(parent){
 | 
			
		||||
                    int px= x>>1;
 | 
			
		||||
                    int py= y>>1;
 | 
			
		||||
@ -2062,7 +1974,8 @@ static inline void decode_subband(SnowContext *s, SubBand *b, DWTELEM *src, DWTE
 | 
			
		||||
                    if(get_cabac(&s->c, &b->state[0][16 + 1 + 3 + quant3b[l&0xFF] + 3*quant3b[t&0xFF]]))
 | 
			
		||||
                        v= -v;
 | 
			
		||||
                    src[x + y*stride]= v;
 | 
			
		||||
                    b->x[index++]=x;
 | 
			
		||||
                    b->x[index++]=x; //FIXME interleave x/coeff
 | 
			
		||||
//                    b->coeff[index++]= v;
 | 
			
		||||
                }
 | 
			
		||||
            }
 | 
			
		||||
            b->x[index++]= w+1; //end marker
 | 
			
		||||
@ -2896,15 +2809,6 @@ static int decode_header(SnowContext *s){
 | 
			
		||||
    return 0;
 | 
			
		||||
}
 | 
			
		||||
 | 
			
		||||
static int init_subband(SubBand *b, int w, int h, int stride){
 | 
			
		||||
    b->width= w;
 | 
			
		||||
    b->height= h;
 | 
			
		||||
    b->stride= stride;
 | 
			
		||||
    b->buf= av_mallocz(b->stride * b->height*sizeof(DWTELEM));
 | 
			
		||||
    b->x= av_mallocz(((b->width+1) * b->height+1)*sizeof(int16_t));
 | 
			
		||||
    return 0;
 | 
			
		||||
}
 | 
			
		||||
 | 
			
		||||
static int common_init(AVCodecContext *avctx){
 | 
			
		||||
    SnowContext *s = avctx->priv_data;
 | 
			
		||||
    int width, height;
 | 
			
		||||
@ -2989,7 +2893,8 @@ static int common_init(AVCodecContext *avctx){
 | 
			
		||||
                
 | 
			
		||||
                if(level)
 | 
			
		||||
                    b->parent= &s->plane[plane_index].band[level-1][orientation];
 | 
			
		||||
                b->x= av_mallocz(((b->width+1) * b->height+1)*sizeof(int16_t));
 | 
			
		||||
                b->x    = av_mallocz(((b->width+1) * b->height+1)*sizeof(int16_t));
 | 
			
		||||
                b->coeff= av_mallocz(((b->width+1) * b->height+1)*sizeof(DWTELEM));
 | 
			
		||||
            }
 | 
			
		||||
            w= (w+1)>>1;
 | 
			
		||||
            h= (h+1)>>1;
 | 
			
		||||
@ -3311,6 +3216,7 @@ static void common_end(SnowContext *s){
 | 
			
		||||
                SubBand *b= &s->plane[plane_index].band[level][orientation];
 | 
			
		||||
                
 | 
			
		||||
                av_freep(&b->x);
 | 
			
		||||
                av_freep(&b->coeff);
 | 
			
		||||
            }
 | 
			
		||||
        }
 | 
			
		||||
    }
 | 
			
		||||
 | 
			
		||||
		Loading…
	
	
			
			x
			
			
		
	
		Reference in New Issue
	
	Block a user