// -*- mode:C++ ; compile-command: "g++-3.4 -I.. -I../include -g -c -Wall modpoly.cc -DHAVE_CONFIG_H -DIN_GIAC" -*- // N.B.: compiling with g++-3.4 -O2 -D_I386_ does not work #include "giacPCH.h" /* Univariate dense polynomials including modular arithmetic * Copyright (C) 2000,2014 B. Parisse, Institut Fourier, 38402 St Martin d'Heres * * This program is free software; you can redistribute it and/or modify * it under the terms of the GNU General Public License as published by * the Free Software Foundation; either version 3 of the License, or * (at your option) any later version. * * This program is distributed in the hope that it will be useful, * but WITHOUT ANY WARRANTY; without even the implied warranty of * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * GNU General Public License for more details. * * You should have received a copy of the GNU General Public License * along with this program. If not, see . */ using namespace std; #ifdef HAVE_CONFIG_H #include "config.h" #endif #include "sym2poly.h" #include "modpoly.h" #include "usual.h" #include "prog.h" #include "derive.h" #include "ezgcd.h" #include "cocoa.h" // for memory_usage #include "quater.h" #include "modfactor.h" #include "giacintl.h" #include #include #include #include #ifdef HAVE_SYS_TIME_H #include #else #if !defined BESTA_OS && !defined EMCC && !defined EMCC2 #define clock_t int #define CLOCK() 0 #endif #endif #define GIAC_PRECOND 1 // if multiplying by w mod p, pre-computes (w*2^32)/p //#define GIAC_CACHEW 1 // FFT, cache w^(2^t*p) for t>0 #if defined GIAC_CACHEW && GIAC_PRECOND #undef GIAC_PRECOND // incompatible #endif // vector class version 1 by Agner Fog https://github.com/vectorclass // this might be faster for CPU with AVX512DQ instruction set // (fast multiplication of Vec4q) #ifdef HAVE_VCL1_VECTORCLASS_H #include #endif #ifndef NO_NAMESPACE_GIAC namespace giac { #endif // ndef NO_NAMESPACE_GIAC const double prec(1.0/(1LL<<51)); // 52? double find_invp(int p){ return (1.0/p)*(1.0-prec); // insure that invp is lower than 1/p } // Fourier primes that fit in 32 bit int const int p1=2013265921,p2=1811939329,p3=469762049,p4=2113929217; const double invp1=(1.0-prec)/p1,invp2=(1.0-prec)/p2,invp3=(1.0-prec)/p3,invp4=(1.0-prec)/p4; const longlong p1p2=longlong(p1)*p2,p1p2sur2=p1p2/2; gen _fft_mult_size(const gen & args,GIAC_CONTEXT){ if (args.type==_VECT && args._VECTptr->empty()) return FFTMUL_SIZE; if (args.type!=_INT_ || args.val<1) return gensizeerr(contextptr); return FFTMUL_SIZE=args.val; } static const char _fft_mult_size_s []="fft_mult_size"; static define_unary_function_eval (__fft_mult_size,&_fft_mult_size,_fft_mult_size_s); define_unary_function_ptr5( at_fft_mult_size ,alias_at_fft_mult_size,&__fft_mult_size,0,true); static const char _fft_mult_s []="fft_mult"; static define_unary_function_eval (__fft_mult,&_fft_mult_size,_fft_mult_s); define_unary_function_ptr5( at_fft_mult ,alias_at_fft_mult,&__fft_mult,0,true); gen _min_proba_time(const gen & args,GIAC_CONTEXT){ if (args.type==_INT_ && args.val>=0) return min_proba_time=args.val; if (args.type==_DOUBLE_ && args._DOUBLE_val>=0) return min_proba_time=args._DOUBLE_val; if (args.type==_VECT && args._VECTptr->empty()) return min_proba_time; return gensizeerr(contextptr); } static const char _min_proba_time_s []="min_proba_time"; static define_unary_function_eval (__min_proba_time,&_min_proba_time,_min_proba_time_s); define_unary_function_ptr5( at_min_proba_time ,alias_at_min_proba_time,&__min_proba_time,0,true); // random modular number gen nrandom(environment * env){ if (env->moduloon && is_zero(env->coeff)){ double d=env->modulo.to_int(); int j=(int) (d*std_rand()/(RAND_MAX+1.0)); return smod(gen(j),env->modulo); } else { double d=env->pn.to_int(); int j=(int) (d*std_rand()/(RAND_MAX+1.0)); return env->coeff.makegen(j); } } gen invenv(const gen & g,environment * env){ if (g.type==_USER) return g._USERptr->inv(); return invmod(g,env->modulo); } /* void inpowmod(const gen & a,int n,const gen & m,gen & res){ if (!n){ res=gen(1); return ; } if (n==1){ res=a; return ; } inpowmod(a,n/2,m,res); res=smod((res*res),m); if (n%2) res=smod((res*a),m); } gen powmod(const gen & a,int n,const gen & m){ if (!n) return 1; if (n==1) return a; assert(n>1); gen res; inpowmod(a,n,m,res); return res; } */ unsigned powmod(unsigned a,unsigned long n,unsigned m){ if (!n) return 1; if (n==1) return a; if (n==2) return (a*ulonglong(a))%m; unsigned b=a%m,c=1; while (n>0){ if (n%2) c=(c*ulonglong(b))%m; n /= 2; b=(b*ulonglong(b))%m; } return c; } modpoly derivative(const modpoly & p){ if (p.empty()) return p; modpoly new_coord; int d=int(p.size())-1; new_coord.reserve(d); modpoly::const_iterator it=p.begin(); // itend=p.end(), for (;d;++it,--d) new_coord.push_back((*it)*gen(d)); return new_coord; } modpoly derivative(const modpoly & p,environment * env){ if (p.empty()) return p; modpoly new_coord; int d=int(p.size())-1; new_coord.reserve(d); modpoly::const_iterator it=p.begin(); // itend=p.end(), gen n0( 0); for (;d;++it,--d) if ( smod((*it)*gen(d),env->modulo)!=n0 ) break; for (;d;++it,--d) new_coord.push_back( smod((*it)*gen(d),env->modulo) ); return new_coord; } modpoly integrate(const modpoly & p,const gen & shift_coeff){ if (p.empty()) return p; modpoly new_coord; new_coord.reserve(p.size()); modpoly::const_iterator itend=p.end(),it=p.begin(); for (int d=0;it!=itend;++it,++d) new_coord.push_back(normal(rdiv((*it),gen(d)+shift_coeff,context0),context0)); return new_coord; } static bool is_rational(double d,int & num,int & den,double eps){ double dcopy(d); // continued fraction expansion vector v; for (int n=1;n<11;++n){ v.push_back(int(d)); d=d-int(d); if (fabs(d)::const_iterator it=v.begin();it!=v.end();++it){ num=num+den*(*it); swap(num,den); } swap(num,den); return fabs(dcopy-(num*1.0)/den)type==_POLY){ if (it->_POLYptr->coord.empty()) e=zero; else { if (Tis_constant(*it->_POLYptr)) e=it->_POLYptr->coord.front().value; else return 0; } } else e=*it; if (e.type!=_INT_) return 0; q.push_back(e); } // q has integer coeff, q(X) must be = X^n conj(q(1/conj(X))) // if it has all its root over the unit circle // since q has integer coeff, q=X^n*q(1/X) i.e. is symmetric modpoly qs(q); reverse(q.begin(),q.end()); if (q!=qs) return 0; // find arg of a root and compare to 2*pi gen r=a_root(qs,0,eps); if (is_undef(r)) return 0; double arg_d=evalf_double(arg(r,context0),1,context0)._DOUBLE_val; if (arg_d<0) arg_d=-arg_d; double d=2*M_PI/ arg_d; // find rational approx of d int num,den; if (!is_rational(d,num,den,eps) || num>100) return 0; if (p==cyclotomic(num)) return num; else return 0; } int is_cyclotomic(const modpoly & p,GIAC_CONTEXT){ return is_cyclotomic(p,epsilon(contextptr)); } // use 0 for Z, n!=0 for Z/nZ modpoly modularize(const polynome & p,const gen & n,environment * env){ bool ismod; if (env && env->coeff.type!=_USER && !is_zero(n)){ env->modulo=n; env->pn=env->modulo; ismod=true; env->moduloon=true; } else ismod=false; gen n0(0); vecteur v; if (p.dim!=1) return vecteur(1,gensizeerr(gettext("modpoly.cc/modularize"))); if (p.coord.empty()) return v; int deg=p.lexsorted_degree(); int curpow=deg; v.reserve(deg+1); vector< monomial >::const_iterator it=p.coord.begin(); vector< monomial >::const_iterator itend=p.coord.end(); for (;it!=itend;++it){ int newpow=it->index.front(); for (;curpow>newpow;--curpow) v.push_back(n0); if (ismod) v.push_back(smod(it->value,env->modulo)); else v.push_back(it->value); --curpow; } for (;curpow>-1;--curpow) v.push_back(n0); return v; } modpoly modularize(const dense_POLY1 & p,const gen & n,environment * env){ env->modulo=n; env->pn=env->modulo; env->moduloon=true; if (p.empty()) return p; modpoly v; gen n0( 0); dense_POLY1::const_iterator it=p.begin(),itend=p.end(); for (;it!=itend;++it){ if (smod(*it,n)!=n0) break; } for (;it!=itend;++it) v.push_back(smod(*it,n)); return v; } polynome unmodularize(const modpoly & a){ if (a.empty()) return polynome(1); vector< monomial > v; index_t i; int deg=int(a.size())-1; i.push_back(deg); vecteur::const_iterator it=a.begin(); vecteur::const_iterator itend=a.end(); gen n0( 0); for (;it!=itend;++it,--i[0]){ if (*it!=n0) v.push_back(monomial(*it,i)); } return polynome(1,v); } // random polynomial of degree =i modpoly random(int i,environment * env){ vecteur v; v.reserve(i+1); gen e; do e=nrandom(env); while (is_zero(e)); v.push_back(e); for (int j=1;j<=i;j++) v.push_back(nrandom(env)); return v; } bool is_one(const modpoly & p){ if (p.size()!=1) return false; return (is_one(p.front())); } // 1 modpoly one(){ vecteur v; v.push_back(gen(1)); return v; } // x=x^1 modpoly xpower1(){ vecteur v; v.push_back(gen( 1)); v.push_back(gen( 0)); return v; } bool normalize_env(environment * env){ if ( (env->moduloon && is_zero(env->coeff)) || is_zero(env->pn)){ env->pn=env->modulo; if (env->complexe) env->pn = env->pn * env->pn ; } return (env->pn.type==_INT_); } // x^modulo modpoly xpowerpn(environment * env){ if (!normalize_env(env)) return vecteur(1,gendimerr(gettext("Field too large"))); int deg=env->pn.val; vecteur v(deg+1); v[0]=1; return v; } // x -> x^p (non modular) vecteur x_to_xp(const vecteur & v, int p){ if (p<=0) return vecteur(1,gensizeerr(gettext("modpoly.cc/x_to_xp"))); if ( (p==1) || v.empty()) return v; const_iterateur it=v.begin(),itend=v.end(); vecteur res; res.reserve(1+(itend-it-1)*p); res.push_back(*it); ++it; for (;it!=itend;++it){ for (int i=1;in){ // swap th and other in order to have n>=m modpoly::const_iterator tmp=th_it; th_it=other_it; other_it=tmp; tmp=th_itend; th_itend=other_itend; other_itend=tmp; int saven=n; n=m; m=saven; } if (m && other_it==new_coord.begin()){ modpoly temp(new_coord); Addmodpoly(th_it,th_itend,temp.begin(),temp.end(),env,new_coord); return; } if (n && (th_it==new_coord.begin()) ){ modpoly::iterator th=new_coord.begin()+n-m; bool trim=(n==m); // in-place addition if (env && env->moduloon) for (;m;++th,++other_it,--m) *th=smod((*th)+(*other_it), env->modulo); else for (;m;++th,++other_it,--m) *th += (*other_it); if (trim){ for (th=new_coord.begin();th!=th_itend;++th){ if (!is_zero(*th)) break; } new_coord.erase(new_coord.begin(),th); } return; } new_coord.clear(); if ( (n<0) || (m<0) ) return ; new_coord.reserve(n); if (n>m){ // no trimming needed for (;n>m;++th_it,--n) new_coord.push_back(*th_it); } else { // n==m, first remove all 0 terms of the sum if (env && env->moduloon) for (;n && is_zero(smod((*th_it)+(*other_it), env->modulo));++th_it,++other_it,--n) ; else for (;n && is_zero(*th_it+*other_it);++th_it,++other_it,--n) ; } // finish addition if (env && env->moduloon) for (;n;++th_it,++other_it,--n) new_coord.push_back(smod((*th_it)+(*other_it), env->modulo)); else for (;n;++th_it,++other_it,--n) new_coord.push_back( *th_it+(*other_it) ); } void addmodpoly(const modpoly & th, const modpoly & other, environment * env,modpoly & new_coord){ // assert( (&th!=&new_coord) && (&other!=&new_coord) ); modpoly::const_iterator th_it=th.begin(),th_itend=th.end(); modpoly::const_iterator other_it=other.begin(),other_itend=other.end(); Addmodpoly(th_it,th_itend,other_it,other_itend,env,new_coord); } void addmodpoly(const modpoly & th, const modpoly & other, modpoly & new_coord){ // assert( (&th!=&new_coord) && (&other!=&new_coord) ); modpoly::const_iterator th_it=th.begin(),th_itend=th.end(); modpoly::const_iterator other_it=other.begin(),other_itend=other.end(); environment * env=new environment; Addmodpoly(th_it,th_itend,other_it,other_itend,env,new_coord); delete env; } // modular polynomial arithmetic: gcd, egcd, simplify modpoly operator_plus (const modpoly & th,const modpoly & other,environment * env) { #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } // Tensor addition if (th.empty()) return other; if (other.empty()) return th; modpoly new_coord; addmodpoly(th,other,env,new_coord); return new_coord; } modpoly operator + (const modpoly & th,const modpoly & other) { #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } // Tensor addition if (th.empty()) return other; if (other.empty()) return th; modpoly new_coord; addmodpoly(th,other,new_coord); return new_coord; } void Submodpoly(modpoly::const_iterator th_it,modpoly::const_iterator th_itend,modpoly::const_iterator other_it,modpoly::const_iterator other_itend,environment * env,modpoly & new_coord){ int n=int(th_itend-th_it); if (!n){ new_coord=modpoly(other_it,other_itend); mulmodpoly(new_coord,-1,new_coord); return; } int m=int(other_itend-other_it); if (th_it==new_coord.begin()){ if (nmoduloon) for (;m;++th,++other_it,--m) *th=smod((*th)-(*other_it), env->modulo); else for (;m;++th,++other_it,--m) *th -= (*other_it); if (trim){ for (th=new_coord.begin();th!=th_itend;++th){ if (!is_zero(*th)) break; } new_coord.erase(new_coord.begin(),th); } } return; } if (m && (other_it==new_coord.begin()) ){ bool inplace=(m>n); if (n==m){ // look if highest coeff vanishes if (env && env->moduloon) inplace=!is_zero(smod((*th_it)-(*other_it), env->modulo)); else inplace=!is_zero((*th_it)-(*other_it)); } if (inplace){ // in-place subtraction modpoly::iterator th=new_coord.begin(); if (env && env->moduloon){ for (;m>n;++th,--m) *th=smod(-(*th),env->modulo); for (;m;++th_it,++th,--m) *th=smod((*th_it)-(*th), env->modulo); } else { for (;m>n;++th,--m) *th=-(*th); for (;m;++th_it,++th,--m) *th=(*th_it)-(*th); } return; } else { // copy new_coord to a temporary and call again Addmodpoly modpoly temp(new_coord); Submodpoly(th_it,th_itend,temp.begin(),temp.end(),env,new_coord); return; } } if ( (n<0) || (m<0) ) return ; new_coord.clear(); new_coord.reserve(giacmax(n,m)); bool trimming; if (m==n) trimming=true; else trimming=false; if (env && env->moduloon){ for (;m>n;++other_it,--m) new_coord.push_back(smod(-*other_it,env->modulo)); } else { for (;m>n;++other_it,--m) new_coord.push_back(-*other_it); } for (;n>m;++th_it,--n) new_coord.push_back(*th_it); if (env && env->moduloon) for (;n;++th_it,++other_it,--n){ gen tmp=smod((*th_it)-(*other_it), env->modulo); if ( trimming){ if (!is_zero(tmp)){ trimming=false; new_coord.push_back(tmp); } } else new_coord.push_back(tmp); } else for (;n;++th_it,++other_it,--n){ gen tmp=(*th_it)-(*other_it); if ( trimming){ if (!is_zero(tmp)){ trimming=false; new_coord.push_back(tmp); } } else new_coord.push_back(tmp); } } void submodpoly(const modpoly & th, const modpoly & other, environment * env,modpoly & new_coord){ // assert( (&th!=&new_coord) && (&other!=&new_coord) ); modpoly::const_iterator th_it=th.begin(),th_itend=th.end(); modpoly::const_iterator other_it=other.begin(),other_itend=other.end(); Submodpoly(th_it,th_itend,other_it,other_itend,env,new_coord); } void submodpoly(const modpoly & th, const modpoly & other, modpoly & new_coord){ // assert( (&th!=&new_coord) && (&other!=&new_coord) ); modpoly::const_iterator th_it=th.begin(),th_itend=th.end(); modpoly::const_iterator other_it=other.begin(),other_itend=other.end(); environment * env=new environment; Submodpoly(th_it,th_itend,other_it,other_itend,env,new_coord); delete env; } modpoly operator_minus (const modpoly & th,const modpoly & other,environment * env) { #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } // Tensor sub if (th.empty()) return -other; if (other.empty()) return th; modpoly new_coord; submodpoly(th,other,env,new_coord); return new_coord; } modpoly operator - (const modpoly & th,const modpoly & other) { #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } // Tensor sub if (th.empty()) return -other; if (other.empty()) return th; modpoly new_coord; submodpoly(th,other,new_coord); return new_coord; } void mulmodpoly(const modpoly & th, const gen & fact,environment * env, modpoly & new_coord){ if (!env || !env->moduloon){ mulmodpoly(th,fact,new_coord); return; } if (is_exactly_zero(fact)){ new_coord.clear(); return ; } if (&th==&new_coord){ if (is_one(fact)) return; modpoly::iterator it=new_coord.begin(),itend=new_coord.end(); if (!env->complexe && (env->modulo.type==_INT_) && (fact.type==_INT_) && (env->modulo.valval=smod( (it->val)*fact.val,env->modulo.val ) ; } else { for (;it!=itend;++it) *it=smod( (*it)*fact,env->modulo); } } else { // &th!=&new_coord if (is_one(fact)){ new_coord=th; return; } new_coord.clear(); new_coord.reserve(th.size()); modpoly::const_iterator it=th.begin(),itend=th.end(); if (!env->complexe && (env->modulo.type==_INT_) && (fact.type==_INT_) && (env->modulo.valval)*fact.val,env->modulo.val) ); } else { for (;it!=itend;++it) new_coord.push_back(smod( (*it)*fact,env->modulo) ); } } } void mulmodpoly(const modpoly & th, const gen & fact, modpoly & new_coord){ if (is_exactly_zero(fact)){ new_coord.clear(); return ; } if (&th==&new_coord){ if (is_one(fact)) return; modpoly::iterator it=new_coord.begin(),itend=new_coord.end(); #ifndef USE_GMP_REPLACEMENTS if (fact.type==_INT_){ for (;it!=itend;++it){ if (it->type==_ZINT && it->ref_count()==1) mpz_mul_si(*it->_ZINTptr,*it->_ZINTptr,fact.val); else *it= (*it)*fact; } return; } if (fact.type==_ZINT){ for (;it!=itend;++it){ if (it->type==_ZINT && it->ref_count()==1) mpz_mul(*it->_ZINTptr,*it->_ZINTptr,*fact._ZINTptr); else *it= (*it)*fact; } return; } #endif for (;it!=itend;++it) type_operator_times(*it,fact,*it); // *it= (*it)*fact; } else { // &th!=&new_coord new_coord.clear(); new_coord.reserve(th.size()); modpoly::const_iterator it=th.begin(),itend=th.end(); for (;it!=itend;++it) new_coord.push_back((*it)*fact); } } modpoly operator * (const modpoly & th, const gen & fact){ #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } // Tensor constant multiplication if (is_one(fact)) return th; modpoly new_coord; mulmodpoly(th,fact,new_coord); return new_coord; } modpoly operator * (const gen & fact,const modpoly & th){ #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } if (is_one(fact)) return th; modpoly new_coord; mulmodpoly(th,fact,new_coord); return new_coord; } modpoly operator * (const modpoly & a, const modpoly & b) { environment env; modpoly temp(operator_times(a,b,&env)); return temp; } modpoly operator_times(const modpoly & th, const gen & fact,environment * env){ #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } // Tensor constant multiplication if (is_one(fact)) return th; modpoly new_coord; mulmodpoly(th,fact,env,new_coord); return new_coord; } modpoly operator_times(const gen & fact,const modpoly & th,environment * env){ #ifdef TIMEOUT control_c(); #endif if (ctrl_c || interrupted) { interrupted = true; ctrl_c=false; return modpoly(1,gensizeerr(gettext("Stopped by user interruption."))); } if (is_one(fact)) return th; modpoly new_coord; mulmodpoly(th,fact,env,new_coord); return new_coord; } // *res = *res + a*b, *res must not be elsewhere referenced inline void add_mul(mpz_t * res,mpz_t & prod,const gen &a,const gen &b){ switch ( (a.type<< _DECALAGE) | b.type) { case _INT___INT_: mpz_set_si(prod,a.val); #ifdef mpz_mul_si mpz_mul_si(prod,prod,b.val); #else if (b.val<0){ mpz_mul_ui(prod,prod,-b.val); mpz_neg(prod,prod); } else mpz_mul_ui(prod,prod,b.val); #endif break; case _ZINT__ZINT: mpz_mul(prod,*a._ZINTptr,*b._ZINTptr); break; case _INT___ZINT: #ifdef mpz_mul_si mpz_mul_si(prod,*b._ZINTptr,a.val); #else if (a.val<0){ mpz_mul_ui(prod,*b._ZINTptr,-a.val); mpz_neg(prod,prod); } else mpz_mul_ui(prod,*b._ZINTptr,a.val); #endif break; case _ZINT__INT_: #ifdef mpz_mul_si mpz_mul_si(prod,*a._ZINTptr,b.val); #else if (b.val<0){ mpz_mul_ui(prod,*a._ZINTptr,-b.val); mpz_neg(prod,prod); } else mpz_mul_ui(prod,*a._ZINTptr,b.val); #endif break; } mpz_add(*res,*res,prod); } // *res = *res - a*b, *res must not be referenced elsewhere inline void sub_mul(mpz_t * res,mpz_t & prod,const gen &a,const gen &b){ switch ( (a.type<< _DECALAGE) | b.type) { case _INT___INT_: mpz_set_si(prod,a.val); #ifdef mpz_mul_si mpz_mul_si(prod,prod,b.val); #else if (b.val<0){ mpz_mul_ui(prod,prod,-b.val); mpz_neg(prod,prod); } else mpz_mul_ui(prod,prod,b.val); #endif break; case _ZINT__ZINT: mpz_mul(prod,*a._ZINTptr,*b._ZINTptr); break; case _INT___ZINT: #ifdef mpz_mul_si mpz_mul_si(prod,*b._ZINTptr,a.val); #else if (a.val<0){ mpz_mul_ui(prod,*b._ZINTptr,-a.val); mpz_neg(prod,prod); } else mpz_mul_ui(prod,*b._ZINTptr,a.val); #endif break; case _ZINT__INT_: #ifdef mpz_mul_si mpz_mul_si(prod,*a._ZINTptr,b.val); #else if (b.val<0){ mpz_mul_ui(prod,*a._ZINTptr,-b.val); mpz_neg(prod,prod); } else mpz_mul_ui(prod,*a._ZINTptr,b.val); #endif break; } mpz_sub(*res,*res,prod); } // set madeg to RAND_MAX if no truncation in degree static void Muldense_POLY1(const modpoly::const_iterator & ita0,const modpoly::const_iterator & ita_end,const modpoly::const_iterator & itb0,const modpoly::const_iterator & itb_end,environment * env,modpoly & new_coord,int taille,int maxdeg){ if (ita0==ita_end || itb0==itb_end || maxdeg<0){ new_coord.clear(); return; } mpz_t prod; mpz_init(prod); int newdeg=(ita_end-ita0)+(itb_end-itb0)-2,skip=0; if (maxdeg>=0 && newdeg>maxdeg){ skip=newdeg-maxdeg; newdeg=maxdeg; } new_coord.resize(newdeg+1); modpoly::const_iterator ita_begin=ita0-1,ita=ita0,itb=itb0; gen * target=&new_coord.front(); if (taille<128) taille=0; else { taille=sizeinbase2(taille/128); taille=(128 << taille); } ref_mpz_t * res = new ref_mpz_t(taille?taille:128); for ( ; ita!=ita_end; ++ita ){ if (skip){ --skip; continue; } modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;itb_cur!=itb_end && ita_cur!=ita_begin;--ita_cur,++itb_cur) { add_mul(&res->z,prod,*ita_cur,*itb_cur); // res = res + (*ita_cur) * (*itb_cur); } int oldtaille=mpz_sizeinbase(res->z,2); if (env && env->moduloon){ *target=smod(gen(res),env->modulo); res = new ref_mpz_t(taille?taille:oldtaille+64); } else { // *target=res; if (ref_mpz_t2gen(res,*target)) res = new ref_mpz_t(taille?taille:oldtaille+64); else mpz_set_si(res->z,0); } ++target; } --ita; ++itb; for ( ; itb!=itb_end;++itb){ if (skip){ --skip; continue; } modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;itb_cur!=itb_end && ita_cur!=ita_begin;--ita_cur,++itb_cur) { add_mul(&res->z,prod,*ita_cur,*itb_cur); // res=res+((*ita_cur)) * ((*itb_cur)); } int oldtaille=mpz_sizeinbase(res->z,2); if (env && env->moduloon){ *target=smod(gen(res),env->modulo); res = new ref_mpz_t(taille?taille:oldtaille); } else { // *target=res; if (ref_mpz_t2gen(res,*target)) res = new ref_mpz_t(taille?taille:oldtaille); else mpz_set_si(res->z,0); } ++target; } delete res; mpz_clear(prod); } // new_coord += a*b, used in gen.cc void add_mulmodpoly(const modpoly::const_iterator & ita0,const modpoly::const_iterator & ita_end,const modpoly::const_iterator & itb0,const modpoly::const_iterator & itb_end,environment * env,modpoly & new_coord){ if (ita0==ita_end || itb0==itb_end) return; bool same=ita0==itb0 && ita_end==itb_end; mpz_t prod; mpz_init(prod); int ncs=int(new_coord.size()); int news=int((ita_end-ita0)+(itb_end-itb0)-1); if (ncsnews) target += (ncs-news); for ( ; ita!=ita_end; ++ita,++target ){ if (!env && target->type==_ZINT && target->ref_count()==1){ mpz_t * resz=target->_ZINTptr; modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;itb_cur!=itb_end && ita_cur!=ita_begin;--ita_cur,++itb_cur) { add_mul(resz,prod,*ita_cur,*itb_cur); // res = res + (*ita_cur) * (*itb_cur); } } else { ref_mpz_t * res=new ref_mpz_t; mpz_t * resz=&res->z; if (target->type==_INT_) mpz_set_si(*resz,target->val); else mpz_set(*resz,*target->_ZINTptr); modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;itb_cur!=itb_end && ita_cur!=ita_begin;--ita_cur,++itb_cur) { add_mul(resz,prod,*ita_cur,*itb_cur); // res = res + (*ita_cur) * (*itb_cur); } if (env && env->moduloon) *target=smod(gen(res),env->modulo); else *target=res; } } --ita; ++itb; for ( ; itb!=itb_end;++itb,++target){ if (!env && target->type==_ZINT && target->ref_count()==1){ mpz_t * resz=target->_ZINTptr; modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;itb_cur!=itb_end && ita_cur!=ita_begin;--ita_cur,++itb_cur) { add_mul(resz,prod,*ita_cur,*itb_cur); // res = res + (*ita_cur) * (*itb_cur); } } else { ref_mpz_t * res=new ref_mpz_t; mpz_t * resz=&res->z; if (target->type==_INT_) mpz_set_si(*resz,target->val); else mpz_set(*resz,*target->_ZINTptr); modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;itb_cur!=itb_end && ita_cur!=ita_begin;--ita_cur,++itb_cur) { add_mul(resz,prod,*ita_cur,*itb_cur); // res = res + (*ita_cur) * (*itb_cur); } if (env && env->moduloon) *target=smod(gen(res),env->modulo); else *target=res; } } mpz_clear(prod); } // new_coord memory must be reserved, Mulmodpoly clears new_coord // set madeg to RAND_MAX if no truncation in degree static void Mulmodpolymod(modpoly::const_iterator ita,modpoly::const_iterator ita_end,modpoly::const_iterator itb,modpoly::const_iterator itb_end,environment * env,modpoly & new_coord,bool intcoeff,int taille,int seuil_kara,int maxdeg){ if (maxdeg<0) return; if (ita_end-ita-1>maxdeg) ita=ita_end-maxdeg-1; if (itb_end-itb-1>maxdeg) itb=itb_end-maxdeg-1; int a=int(ita_end-ita); int b=int(itb_end-itb); if (!b) return ; if ( ( a <= seuil_kara) || ( b <= seuil_kara) ){ if (intcoeff) Muldense_POLY1(ita,ita_end,itb,itb_end,env,new_coord,taille,maxdeg); else mulmodpoly_naive(ita,ita_end,itb,itb_end,env,new_coord); return ; } if (a=b){ // cut A in a/b+1 parts int nslices=a/b; // number of submultiplications -1 ita_mid=ita+b; int maxdeg_shift = ita_end-ita_mid; Mulmodpolymod(itb,itb_end,ita,ita_mid,env,new_coord,intcoeff,taille,seuil_kara,maxdeg-maxdeg_shift); // initialization modpoly low; low.reserve(b*b); for (int i=1;i=maxdeg/2-4){ Mulmodpolymod(ita,ita_mid,itb,itb_mid,env,new_coord,intcoeff,taille,seuil_kara,maxdeg-2*mid); Mulmodpolymod(ita,ita_mid,itb_mid,itb_end,env,Aplus,intcoeff,taille,seuil_kara,maxdeg-mid); Mulmodpolymod(ita_mid,ita_end,itb,itb_mid,env,Bplus,intcoeff,taille,seuil_kara,maxdeg-mid); addmodpoly(Aplus,Bplus,env,Aplus); shiftmodpoly(new_coord,mid); addmodpoly(new_coord,Aplus,env,new_coord); shiftmodpoly(new_coord,mid); addmodpoly(new_coord,lowlow,env,new_coord); trim_inplace(new_coord); return; } // COUT << "lowlow" << lowlow << '\n'; // new_coord.reserve(2*mid); Mulmodpolymod(ita,ita_mid,itb,itb_mid,env,new_coord,intcoeff,taille,seuil_kara,RAND_MAX); #if 0 if (same){ // (a+bx)^2=a^2+2*a*b*x+b^2*x^2, slower because a*b is not a square // a^2+b^2*x^2+((a+b)^2-a^2-b^2)*x is faster mergemodpoly(new_coord,lowlow,2*mid); Mulmodpolymod(ita,ita_mid,ita_mid,ita_end,env,lowhigh,intcoeff,taille,seuil_kara,RAND_MAX); mulmodpoly(lowhigh,2,lowhigh); shiftmodpoly(lowhigh,mid); addmodpoly(new_coord,lowhigh,env,new_coord); return; } #endif // COUT << "new_coord" << new_coord << '\n'; lowhigh.reserve(3*mid); Addmodpoly(ita,ita_mid,ita_mid,ita_end,env,Aplus); modpoly::const_iterator itap=Aplus.begin(),itap_end=Aplus.end(); if (same){ Mulmodpolymod(itap,itap_end,itap,itap_end,env,lowhigh,intcoeff,taille,seuil_kara,RAND_MAX); } else { Addmodpoly(itb,itb_mid,itb_mid,itb_end,env,Bplus); modpoly::const_iterator itbp=Bplus.begin(),itbp_end=Bplus.end(); Mulmodpolymod(itap,itap_end,itbp,itbp_end,env,lowhigh,intcoeff,taille,seuil_kara,RAND_MAX); } // COUT << "lowhigh" << lowhigh << '\n'; submodpoly(lowhigh,new_coord,env,lowhigh); mergemodpoly(new_coord,lowlow,2*mid); #if 0 submodpoly(lowhigh,lowlow,env,lowhigh); shiftmodpoly(lowhigh,mid); addmodpoly(new_coord,lowhigh,env,new_coord); #else submodpoly(lowhigh,lowlow,env,lowlow); // COUT << "lowh-hh-ll" << lowlow << '\n'; shiftmodpoly(lowlow,mid); addmodpoly(new_coord,lowlow,env,new_coord); #endif // modpoly verif; // Muldense_POLY1(ita,ita_end,itb,itb_end,env,verif); // COUT << "newcoord" << new_coord << "=?" << verif << '\n'; } inline void Muldensemodpolysmall(const modpoly::const_iterator & ita0,const modpoly::const_iterator & ita_end,const modpoly::const_iterator & itb0,const modpoly::const_iterator & itb_end,environment * env,modpoly & new_coord){ new_coord.clear(); if (ita0==ita_end || itb0==itb_end) return; modpoly::const_iterator ita_begin=ita0,ita=ita0,itb=itb0; for ( ; ita!=ita_end; ++ita ){ modpoly::const_iterator ita_cur=ita,itb_cur=itb; int res=0; for (;itb_cur!=itb_end;--ita_cur,++itb_cur) { res += ita_cur->val * itb_cur->val ; if (ita_cur==ita_begin) break; } if (env && env->moduloon) new_coord.push_back(smod(res,env->modulo.val)); else new_coord.push_back(res); } --ita; ++itb; for ( ; itb!=itb_end;++itb){ int res= 0; modpoly::const_iterator ita_cur=ita,itb_cur=itb; for (;;) { res += ita_cur->val * itb_cur->val ; if (ita_cur==ita_begin) break; --ita_cur; ++itb_cur; if (itb_cur==itb_end) break; } if (env && env->moduloon) new_coord.push_back(smod(res,env->modulo.val)); else new_coord.push_back(res); } } static void Mulmodpolysmall(modpoly::const_iterator & ita,modpoly::const_iterator & ita_end,modpoly::const_iterator & itb,modpoly::const_iterator & itb_end,environment * env,modpoly & new_coord){ int a=int(ita_end-ita); int b=int(itb_end-itb); if (!b) return ; if ( ( a <= INT_KARAMUL_SIZE) || ( b <= INT_KARAMUL_SIZE) ){ Muldensemodpolysmall(ita,ita_end,itb,itb_end,env,new_coord); return ; } if (a=b){ // cut A in a/b+1 parts int nslices=a/b; // number of submultiplications -1 ita_mid=ita+b; Mulmodpolysmall(itb,itb_end,ita,ita_mid,env,new_coord); // initialization modpoly low; low.reserve(2*b); for (int i=1;imoduloon) && is_zero(env->coeff) && !env->complexe && (env->modulo.type==_INT_) && (env->modulo.val < smallint) && (product_deg < 65536) ) Mulmodpolysmall(ita,ita_end,itb,itb_end,env,new_coord); else { // test for fft should perhaps take care of the size of env->modulo if ( (1 || (!env || !env->moduloon || env->modulo.type==_INT_) ) && as>=FFTMUL_SIZE && bs>=FFTMUL_SIZE ){ // Check that all coeff are integers for (;ita!=ita_end;++ita){ if (!ita->is_integer()) break; } for (;itb!=itb_end;++itb){ if (!itb->is_integer()) break; } if (ita==ita_end && itb==itb_end){ //CERR << "// fftmult" << '\n'; if (fftmult(a,b,new_coord,(env && env->moduloon && is_zero(env->coeff) && env->modulo.type==_INT_)?env->modulo.val:0,RAND_MAX)){ #if 0 vecteur save=new_coord; Muldense_POLY1(a.begin(),ita_end,b.begin(),itb_end,env,new_coord,0,maxdeg); if (save!=new_coord) CERR << " fft mult error poly1" << a << "*" << b << ";" << (env && env->moduloon && is_zero(env->coeff)?env->modulo:zero) << '\n'; #endif if (env && env->moduloon && env->modulo.type!=_INT_) smod(new_coord,env->modulo,new_coord); return ; } } ita=a.begin(); itb=b.begin(); } int taille=0;//sizeinbase2(a)+sizeinbase2(b); if ((as<=KARAMUL_SIZE) && (bs<=KARAMUL_SIZE)) Muldense_POLY1(ita,ita_end,itb,itb_end,env,new_coord,taille,maxdeg); else Mulmodpolymod(ita,ita_end,itb,itb_end,env,new_coord,true,taille,KARAMUL_SIZE,maxdeg); } } modpoly operator_times(const modpoly & a, const modpoly & b,environment * env) { // Multiplication // COUT << a <<"*" << b << "[" << modulo << "]" << '\n'; if (a.empty()) return a; if (b.empty()) return b; modpoly new_coord; operator_times(a,b,env,new_coord); // COUT << new_coord << '\n'; return new_coord; } modpoly unmod(const modpoly & a,const gen & m){ modpoly res(a); iterateur it=res.begin(),itend=res.end(); for (;it!=itend;++it){ if (is_integer(*it)) continue; if (it->type!=_MOD || *(it->_MODptr+1)!=m) return modpoly(1,gensizeerr("Can not convert "+it->print(context0)+" mod "+m.print(context0))); *it=*it->_MODptr; } return res; } bool unext(const modpoly & a,const gen & pmin,modpoly & res){ res=a; iterateur it=res.begin(),itend=res.end(); for (;it!=itend;++it){ gen g=*it; if (g.type==_FRAC) return false; if (g.type==_EXT){ if (*(g._EXTptr+1)!=pmin) return false; g=*g._EXTptr; if (g.type==_VECT) g.subtype=_POLY1__VECT; *it=g; } } return true; } void ext(modpoly & res,const gen & pmin){ iterateur it=res.begin(),itend=res.end(); for (;it!=itend;++it){ *it=ext_reduce(*it,pmin); } } void modularize(modpoly & a,const gen & m){ iterateur it=a.begin(),itend=a.end(); for (;it!=itend;++it){ *it=makemod(*it,m); } } void mulmodpoly_naive(modpoly::const_iterator ita,modpoly::const_iterator ita_end,modpoly::const_iterator itb,modpoly::const_iterator itb_end,environment * env,modpoly & new_coord){ new_coord.clear(); if (ita==ita_end || itb==itb_end) return; modpoly::const_iterator ita_begin=ita; if (ita==itb && ita_end==itb_end){ // square polynomial // CERR << "square size " << ita_end-ita << '\n'; for ( ; ita!=ita_end; ++ita ){ modpoly::const_iterator ita_cur=ita,itb_cur=itb; gen res; for (;itb_curtype==_VECT?int(it->_VECTptr->size()):1); target.resize(ts); for (int i=0;in) return false; for (int j=vs;j0;++it,--r){ tmp.push_back(*it); } trim(tmp); if (!tmp.empty()) q.push_back(tmp); for (;it!=itend;){ tmp.clear(); for (r=n;r>0;++it,--r){ tmp.push_back(*it); } trim(tmp); q.push_back(tmp.empty()?0:(tmp.size()==1?tmp.front():tmp)); } } // eval p[i] at x in q[i] void horner2(const modpoly & p,const gen & x,modpoly & q){ int ps = int(p.size()); q.resize(ps); for (int i=0;i1) CERR << CLOCK()*1e-6 << " mulmodpoly_interpolate horner2 " << i << '\n'; horner2(p,i,px); if (debug_infolevel>1) CERR << CLOCK()*1e-6 << " mulmodpoly_interpolate mult " << '\n'; if (&p==&q){ mulmodpoly_kara_naive(px,px,0,pqx,20); #if 0 vecteur tmp; mulmodpoly(px,px,0,tmp); if (tmp!=pqx) { ofstream of("bugfft"); of << "p:=" << gen(px,_POLY1__VECT) << ":;" << '\n'; of << "correct p2 " << gen(pqx,_POLY1__VECT) << ":;" << '\n'; of << "wront p2 " << gen(tmp,_POLY1__VECT) << ":;" << '\n'; tmp=pqx-tmp; of << "difference" << tmp << '\n'; } #endif } else { horner2(q,i,qx); mulmodpoly_kara_naive(px,qx,0,pqx,20); } Y.push_back(pqx); } if (debug_infolevel) CERR << CLOCK()*1e-6 << " mulmodpoly_interpolate reorder " << '\n'; vecteur Yr; reorder(Y,Yr); if (debug_infolevel) CERR << CLOCK()*1e-6 << " mulmodpoly_interpolate rebuild " << '\n'; for (int i=0;imoduloon && is_zero(env->coeff)){ mulmodpoly(a,b,env,new_coord,maxdeg); return ; } bool gf=has_gf_coeff(a) || has_gf_coeff(b); #if 1 if (gf){ vector A,B; int M=-1; gen x; int agf=gf_char2_vecteur2vectorint(a,A,x),bgf=gf_char2_vecteur2vectorint(b,B,x); if (agf>0){ if (bgf==0 || agf==bgf) M=agf; } else { if (agf==0 && bgf>0) M=bgf; } if (M>0){ vector R; if (gf_char2_multpoly(A,B,R,M)){ gf_char2_vectorint2vecteur(R,new_coord,M,x); return; } } } if (gf){ vector< vector > A, B,R; vector apmin,bpmin; gen x; int ac=gf_vecteur2vectorvectorint(a,A,x,apmin); if (ac){ int bc=gf_vecteur2vectorvectorint(b,B,x,bpmin); if (bc==ac && apmin==bpmin){ if (gf_multpoly(A,B,R,apmin,ac)){ gf_vectorvectorint2vecteur(R,new_coord,ac,apmin,x); return; } } } } #endif modpoly::const_iterator ita=a.begin(),ita_end=a.end(),itb=b.begin(),itb_end=b.end(); #if 1 if (ita->type==_DOUBLE_ || (ita->type==_CPLX && (ita->subtype==3 || ita->_CPLXptr->type==_DOUBLE_ || (ita->_CPLXptr+1)->type==_DOUBLE_) ) ) { std::vector< complex_double > af,bf; if (convert(a,af,true) && convert(b,bf,true)){ bool real=is_real(a,context0) && is_real(b,context0); int as=int(a.size()),bs=int(b.size()); int rs=as+bs-1; int logrs=sizeinbase2(rs); if (logrs>30) { new_coord=modpoly(1,gensizeerr("Degree too large")); return ;} int n=(1u<type==_EXT){ gen pmin=*(ita->_EXTptr+1); modpoly aa,bb; if (&a==&b && unext(a,pmin,aa)){ #if 0 if (pmin.type==_VECT && to1d(aa,bb,2*pmin._VECTptr->size()-3)){ aa.clear(); mulmodpoly_kara_naive(bb,bb,env,aa,KARAMUL_SIZE); //mulmodpoly(bb,bb,env,aa); from1d(aa,new_coord,2*pmin._VECTptr->size()-3); ext(new_coord,pmin); return; } #endif int n=-1; if (pmin.type==_VECT) n=int(pmin._VECTptr->size())-2; if (n>0 && aa.size()>=512) mulmodpoly_interpolate(aa,aa,n,new_coord); else mulmodpoly_kara_naive(aa,aa,env,new_coord,10); ext(new_coord,pmin); return; } if (unext(a,pmin,aa) && unext(b,pmin,bb)){ if (0 && (aa.size()>=20 || bb.size()>=20)){ modpoly A,B,C; // it's slower reorder(aa,A); reorder(bb,B); mulmodpoly_kara_naive(A,B,env,C,8); reorder(C,new_coord); } else mulmodpoly_kara_naive(aa,bb,env,new_coord,10); ext(new_coord,pmin); return; } } if (ita->type==_MOD //&& (ita->_MODptr+1)->type==_INT_ ){ environment e; e.modulo=*(ita->_MODptr+1); e.moduloon=true; mulmodpoly(unmod(a,e.modulo),unmod(b,e.modulo),&e,new_coord,maxdeg); modularize(new_coord,e.modulo); return; } if (!ita->is_integer()) break; } for (;itb!=itb_end;++itb){ if (itb->type==_MOD //&& (itb->_MODptr+1)->type==_INT_ ){ environment e; e.modulo=*(itb->_MODptr+1); e.moduloon=true; mulmodpoly(unmod(a,e.modulo),unmod(b,e.modulo),&e,new_coord,maxdeg); modularize(new_coord,e.modulo); return; } if (!itb->is_integer()) break; } if (ita==ita_end && itb==itb_end){ // integer coefficients mulmodpoly(a,b,env,new_coord,maxdeg); return; } mulmodpoly_kara_naive(a,b,env,new_coord,KARAMUL_SIZE); } // res=(*it) * ... (*(it_end-1)) void mulmodpoly(vector::const_iterator it,vector::const_iterator it_end,environment * env,modpoly & new_coord){ int n=int(it_end-it); if (n>3){ vector::const_iterator it_mid=it+(it_end-it)/2; modpoly first,second; mulmodpoly(it,it_mid,env,first); mulmodpoly(it_mid,it_end,env,second); mulmodpoly(first,second,env,new_coord); return ; } switch (n){ case 0: return; case 1: new_coord=*it; return; case 2: operator_times(*it,*(it+1),env,new_coord); return; case 3: operator_times(*it,*(it+1),env,new_coord); new_coord=operator_times(*(it+2),new_coord,env); return ; } } void mulmodpoly(vector::const_iterator * it,int debut,int fin,environment * env,modpoly & pi){ // pi = *(it[debut]); // for (int j=debut+1;j<=fin;j++){ // modpoly tmp; // mulmodpoly(pi,*it[j],env,tmp); // pi=tmp; // } //return ; if (fin-debut>2){ int milieu=(debut+fin)/2; modpoly first,second; mulmodpoly(it,debut,milieu,env,first); mulmodpoly(it,milieu+1,fin,env,second); mulmodpoly(first,second,env,pi); return ; } switch (fin-debut){ case 0: pi=*(it[debut]); break; case 1: operator_times(*(it[debut]),*(it[debut+1]),env,pi); break; case 2: operator_times(*(it[debut]),*(it[debut+1]),env,pi); pi=operator_times(pi,(*it[debut+2]),env); break; } } void negmodpoly(const modpoly & th, modpoly & new_coord){ if (&th==&new_coord){ modpoly::iterator a = new_coord.begin(); modpoly::const_iterator a_end = new_coord.end(); for (;a!=a_end;++a){ #ifndef USE_GMP_REPLACEMENTS if (a->type==_ZINT && a->ref_count()==1) mpz_neg(*a->_ZINTptr,*a->_ZINTptr); else #endif *a=-(*a); } } else { new_coord.reserve(th.size()); modpoly::const_iterator a = th.begin(); modpoly::const_iterator a_end = th.end(); for (;a!=a_end;++a) new_coord.push_back(-(*a)); } } modpoly operator - (const modpoly & th) { // Negate modpoly new_coord; negmodpoly(th,new_coord); return new_coord; } // right redimension poly to degree n void rrdm(modpoly & p, int n){ int s=int(p.size()); if (s==n+1) return; for (;s>n+1;--s){ // remove trainling coeff p.pop_back(); } for (;smodulo and trim. (T=int or longlong) void trim_inplace(vector & p,longlong modulo){ if (p.empty()) return ; vector::iterator it=p.begin(),itend=p.end(); while ( (it!=itend) && (*it % modulo==0) ) ++it; vector::iterator it1=it; for (;it1!=itend;++it1){ *it1=smodll(*it1,modulo); } p.erase(p.begin(),it); } void fast_trim_inplace(vector & p,longlong modulo){ if (p.empty()) return ; vector::iterator it=p.begin(),itend=p.end(); while ( (it!=itend) && (*it==0 || *it % modulo==0) ) ++it; p.erase(p.begin(),it); } void trim_inplace(vector & p,int modulo){ if (p.empty()) return ; vector::iterator it=p.begin(),itend=p.end(); while ( (it!=itend) && (*it==0 || *it % modulo==0) ) ++it; vector::iterator it1=it; for (;it1!=itend;++it1){ *it1=smod(*it1,modulo); } p.erase(p.begin(),it); } void fast_trim_inplace(vector & p,int modulo,int maxsize){ if (p.empty()) return ; vector::iterator it=p.begin(),itend=p.end(); if (maxsize>=0 && maxsizemodulo and trim. void trim_inplace(modpoly & p,environment * env){ if (p.empty()) return ; modpoly::iterator it=p.begin(),itend=p.end(); if (env && env->moduloon){ if (env->modulo.type==_ZINT){ mpz_t &mo=*env->modulo._ZINTptr; for (;it!=itend;++it){ if (it->type==_ZINT && it->ref_count()==1){ mpz_t & m=*it->_ZINTptr; mpz_mod(m,m,mo); // not smod-ed if (mpz_cmp_si(m,0)!=0) break; } else { if (!is_zero(smod(*it,env->modulo))) break; } } } else { while ( (it!=itend) && (is_zero(smod(*it,env->modulo))) ) ++it; } } else while ( (it!=itend) && (is_zero(*it)) ) ++it; if (env && env->moduloon){ modpoly::iterator it1=it; if (env->modulo.type==_ZINT){ mpz_t &mo=*env->modulo._ZINTptr; mpz_t mo2; mpz_init_set(mo2,mo); mpz_tdiv_q_2exp(mo2,mo2,1); for (;it1!=itend;++it1){ if (it1->type==_ZINT && it1->ref_count()==1){ mpz_t & m=*it1->_ZINTptr; mpz_mod(m,m,mo); // not smod-ed if (mpz_cmp(m,mo2)>0) mpz_sub(m,m,mo); if (mpz_sizeinbase(m,2)<32) *it1=mpz_get_si(m); } else *it1=smod(*it1,env->modulo); } mpz_clear(mo2); } else { for (;it1!=itend;++it1){ *it1=smod(*it1,env->modulo); } } } p.erase(p.begin(),it); } modpoly trim(const modpoly & p,environment * env){ if (p.empty()) return p; modpoly::const_iterator it=p.begin(),itend=p.end(); if (env && env->moduloon) while ( (it!=itend) && (is_zero(smod(*it,env->modulo))) ) ++it; else while ( (it!=itend) && (is_zero(*it)) ) ++it; modpoly new_coord ; if (env && env->moduloon) for (;it!=itend;++it) new_coord.push_back(smod(*it,env->modulo)); else for (;it!=itend;++it) new_coord.push_back(*it); return new_coord; } void trim_inplace(modpoly & p){ modpoly::iterator it=p.begin(),itend=p.end(); while ( (it!=itend) && (is_zero(*it)) ) ++it; if (it!=p.begin()) p.erase(p.begin(),it); } void divmodpoly(const modpoly & th, const gen & fact, modpoly & new_coord){ if (is_one(fact)){ if (&th!=&new_coord) new_coord=th; return ; } if (fact.type==_USER || fact.type==_EXT){ gen invfact=inv(fact,context0); mulmodpoly(th,invfact,new_coord); return; } if (&th==&new_coord){ modpoly::iterator it=new_coord.begin(),itend=new_coord.end(); for (;it!=itend;++it) // *it =iquo(*it,fact); *it=rdiv(*it,fact,context0); } else { modpoly::const_iterator it=th.begin(),itend=th.end(); for (;it!=itend;++it) new_coord.push_back(rdiv(*it,fact,context0)); // was iquo // new_coord.push_back(iquo(*it,fact)); } } void iquo(modpoly & th,const gen & fact){ modpoly::iterator it=th.begin(),itend=th.end(); #if !defined USE_GMP_REPLACEMENTS && !defined BF2GMP_H if (fact.type==_INT_ && fact.val<0){ iquo(th,-fact); negmodpoly(th,th); return; } if (fact.type==_INT_ ){ for (;it!=itend;++it){ if (it->type==_ZINT && it->ref_count()==1) mpz_tdiv_q_ui(*it->_ZINTptr,*it->_ZINTptr,fact.val); else { if (it->type==_POLY){ polynome copie(*it->_POLYptr); copie /= fact; *it=copie; } else *it=iquo(*it,fact); } } return; } if (fact.type==_ZINT){ for (;it!=itend;++it){ if (it->type==_ZINT && it->ref_count()==1) mpz_tdiv_q(*it->_ZINTptr,*it->_ZINTptr,*fact._ZINTptr); else *it=iquo(*it,fact); } return; } #endif for (;it!=itend;++it) *it=iquo(*it,fact); } void divmodpoly(const modpoly & th, const gen & fact, environment * env,modpoly & new_coord){ if (is_one(fact)){ if (&th!=&new_coord) new_coord=th; return ; } if (!env || !env->moduloon || !is_zero(env->coeff)) divmodpoly(th,fact,new_coord); else { gen factinv(invmod(fact,env->modulo)); mulmodpoly(th,factinv,env,new_coord); } } modpoly operator / (const modpoly & th,const gen & fact ) { if (is_one(fact)) return th; modpoly new_coord; divmodpoly(th,fact,new_coord); return new_coord; } modpoly operator_div (const modpoly & th,const gen & fact,environment * env ) { if (is_one(fact)) return th; modpoly new_coord; divmodpoly(th,fact,env,new_coord); return new_coord; } // fast div rem http://www.csd.uwo.ca/~moreno/CS424/Lectures/FastDivisionAndGcd.html/node3.html // fast modular inverse: f*g=1 mod x^l bool invmod(const modpoly & f,int l,environment * env,modpoly & g){ if (f.empty()) return false; gen finv=f.back(); if (f.back()!=1){ finv=invenv(finv,env); if (finv.type==_FRAC) return false; modpoly F; mulmodpoly(f,finv,env,F); if (!invmod(F,l,env,g)) return false; mulmodpoly(g,finv,env,g); return true; } g=modpoly(1,1); for (longlong i=2;;){ modpoly h,tmp1,tmp2; operator_times(g,g,env,h); if (h.size()>i) h=modpoly(h.end()-i,h.end()); // g=plus_two*g-f*h; mulmodpoly(g,plus_two,env,tmp1); int taille=giacmin(i,l); if (taille>f.size()) taille=f.size(); modpoly F(f.end()-taille,f.end()); operator_times(F,h,env,tmp2); #if 0 // debug int fft_mult_save=FFTMUL_SIZE; FFTMUL_SIZE=1<<30; modpoly tmp3; operator_times(F,h,env,tmp3); if (tmp3!=tmp2) CERR << "Divquo/invmod error" << tmp3-tmp2 << '\n'; FFTMUL_SIZE=fft_mult_save; #endif submodpoly(tmp1,tmp2,env,g); if (g.size()>i) g=modpoly(g.end()-i,g.end()); if (g.size()>l) g=modpoly(g.end()-l,g.end()); g=trim(g,env); if (i>l) break; i=2*i; } return true; } // euclidean quotient using modular inverse int DivQuo(const modpoly & a, const modpoly & b, environment * env,modpoly & q){ q.clear(); int n=a.size(),m=b.size(); if (n=FFTMUL_SIZE && m>=FFTMUL_SIZE && env && env->modulo.type==_INT_){ int p=env->modulo.val,l=sizeinbase2(n); // check if p is a Fourier prime for n int N=1<>l)< A,B,Wp,tmp0; vecteur2vector_int(a,p,A); vecteur2vector_int(b,p,B); to_fft(A,p,w,Wp,N,tmp0,1,false,false); A.swap(tmp0); to_fft(B,p,w,Wp,N,tmp0,1,false,false); B.swap(tmp0); fft_aoverb_p(A,B,tmp0,p); fft_reverse(Wp,p); from_fft(tmp0,p,Wp,A,true,false); fast_trim_inplace(A,p); if (A.size()==s){ vector_int2vecteur(A,q); return 2; } } } } modpoly f(b),g; reverse(f.begin(),f.end()); if (!invmod(f,n-m+1,env,g)) return 0; f=a; reverse(f.begin(),f.end()); operator_times(f,g,env,q); if (q.size()>s) q=modpoly(q.end()-s,q.end()); reverse(q.begin(),q.end()); trim(q,env); return 1; } // for p prime such that p-1 is divisible by 2^N, compute a 2^N-th root of 1 // otherwise return 0 unsigned nthroot(unsigned p,unsigned N){ unsigned expo=(p-1)>>N; if ( (expo< & Wp,unsigned shift,unsigned p){ unsigned n=1<num.type==_ZINT?modulo(*a._FRACptr->num._ZINTptr,m):a._FRACptr->num.val; int d=a._FRACptr->den.type==_ZINT?modulo(*a._FRACptr->den._ZINTptr,m):a._FRACptr->den.val; return (n-longlong(p)*d)%m==0; } if (a.type==_ZINT) return (modulo(*a._ZINTptr,m)-p)%m==0; if (a.type==_INT_) return (a.val-p)%m==0; CERR << "Unknown type in reconstruction " << a << '\n'; return false; } bool chk_equal_mod(const vecteur & a,const vecteur & p,int m){ if (a.size()!=p.size()) return false; const_iterateur it=a.begin(),itend=a.end(),jt=p.begin(); for (;it!=itend;++jt,++it){ if (it->type==_INT_ && *it==*jt) continue; if (jt->type!=_INT_ || !chk_equal_mod(*it,jt->val,m)) return false; } return true; } bool chk_equal_mod(const vecteur & a,const vector & p,int m){ if (a.size()!=p.size()) return false; const_iterateur it=a.begin(),itend=a.end(); vector::const_iterator jt=p.begin(); for (;it!=itend;++jt,++it){ if (it->type==_INT_ && it->val==*jt) continue; if (!chk_equal_mod(*it,*jt,m)) return false; } return true; } inline int precond_mulmod31(int b1,int q1,int p,int q1surp){ b1 += (b1>>31) &p; int t=longlong(b1)*q1-((longlong(b1)*q1surp)>>31)*p; t += (t>>31)&p; // t positive (or at least t-p is valid) return t; } // v *= m mod p void precond_mulmod31(vector & v,int m,int p,int msurp){ vector::iterator it=v.begin(),itend=v.end(); for (;it!=itend;++it){ *it=precond_mulmod31(*it,m,p,msurp); } } void precond_mulmod31(vector & v,int m,int p){ m += (m>>31) &p; int msurp=((1LL<<31)*m)/p+1; msurp += (msurp>>31) & p; precond_mulmod31(v,m,p,msurp); } // invp is 1.0/p*(1.0-prec) < evalf(1/p) with a sufficient bias insuring r>=0 inline int amodp(longlong a,int p,double invp){ longlong q=a*invp; // q<=a/p, maximal relative error: prec+3*2^-53<2^-50 int r= a-q*p; // max absolute error |a|*2^-50<=2^13, hence 0<=r<=p+2^13 if (0 && a>0 && r<0) CERR << "err amodp a=" << a << " p=" << p << " r=" << r << "\n"; #ifndef GIAC_PRECOND r += (r>>31)&p; // this is not required if a>=0 #endif return r; if (r>p && r-p>= (1<<10) )//(r-(a%p)) %p!=0) // ((a-r)%p!=0) CERR << "err amodp a=" << a << " p=" << p << " r=" << r << "\n"; return r; return a%p; } inline int amodpplus(longlong a,int p,double invp){ longlong q=a*invp; // q<=a/p, maximal relative error: prec+3*2^-53<2^-50 int r= a-q*p; // max absolute error |a|*2^-50<=2^13, hence 0<=r<=p+2^13 r += (r>>31)&p; // this is not required if a>=0 return r; } // using apos_modp fails for n:=8000;a:=randpoly(n,3,[]):; b:=randpoly(n+2,3,[]):; ntl_on(false);time(r:=resultant(a,b)); inline int apos_modp(longlong a,int p,double invp){ longlong q=a*invp; // q<=a/p, maximal relative error: prec+3*2^-53<2^-50 int r= a-q*p; // max absolute error |a|*2^-50<=2^13, hence 0<=r<=p+2^13 return r; } void precond_mulmod_double(vector & v,int m,int p,double invp){ vector::iterator it=v.begin(),itend=v.end(); for (;it!=itend;++it){ *it=amodp((*it)*longlong(m),p,invp); } } void precond_mulmod_double(vector & v,int m,int p){ double invp=find_invp(p); precond_mulmod_double(v,m,p,invp); } // Beware, precond_mulmod_double does not work if p is very near from 1ULL<<31 inline void precond_mulmod(vector & v,int m,int p){ if (m==1) return; #if 1 //def GIAC_PRECOND precond_mulmod31(v,m,p); #else precond_mulmod_double(v,m,p); #endif } // ab=a*b mod m, assumes that m is a Fourier prime for qi and ri // returns true if fft was used bool operator_times(const std::vector & a,const std::vector & b,int m,std::vector & ab){ if (a.size() A,B,Wp,tmp0; int l=sizeinbase2(a.size()+b.size()-1); int n=1< & f,int l,int p,std::vector & g){ if (f.empty()) return false; int finv=f.back() % p; finv += (finv>>31) & p; if (finv!=1){ finv=invmod(finv,p); vector F(f); precond_mulmod(F,finv,p); if (!invmod(F,l,p,g)) return false; precond_mulmod(g,finv,p); return true; } g=vector(1,1); for (longlong i=2;;){ vector h,tmp1; operator_times(g,g,p,h); if (h.size()>i) h=vector(h.end()-i,h.end()); // g=plus_two*g-f*h; tmp1=g; precond_mulmod(tmp1,2,p); // tmp1=2*g int taille=giacmin(i,l); if (taille>f.size()) taille=f.size(); vector F(f.end()-taille,f.end()); operator_times(F,h,p,g); submodneg(g,tmp1,p); // g=tmp1-F*h if (g.size()>i) g=vector(g.end()-i,g.end()); if (g.size()>l) g=vector(g.end()-l,g.end()); fast_trim_inplace(g,p); if (i>l) break; i=2*i; } return true; } // euclidean quotient using modular inverse int DivQuo(const std::vector & a, const std::vector & b, int p,std::vector & q,bool ck_exactquo){ q.clear(); int n=a.size(),m=b.size(); if (n=FFTMUL_SIZE && m>=FFTMUL_SIZE){ int l=sizeinbase2(n); // check if p is a Fourier prime for n int N=1<>l)< A,B,Wp,tmp0; to_fft(a,p,w,Wp,N,tmp0,1,false,false); A.swap(tmp0); to_fft(b,p,w,Wp,N,tmp0,1,false,false); B.swap(tmp0); fft_aoverb_p(A,B,tmp0,p); fft_reverse(Wp,p); from_fft(tmp0,p,Wp,q,true,false); fast_trim_inplace(q,p); if (q.size()==s) return 2; } } } vector f(b),g; reverse(f.begin(),f.end()); if (!invmod(f,n-m+1,p,g)) return 0; f=a; reverse(f.begin(),f.end()); operator_times(f,g,p,q); if (q.size()>s) q=vector(q.end()-s,q.end()); reverse(q.begin(),q.end()); fast_trim_inplace(q,p); return 1; } // reconstruct quo and rem by chinese remaindering // quo, rem are already computed for env->modulo bool divremrec(const modpoly & A, const modpoly & B, modpoly & quo, modpoly & rem,environment * env){ gen M=mignotte_bound(A); // works for exact quotient only! gen B0=B[0]; gen pip=env->modulo; gen p=pip; vecteur a,b,q,r,quo_,rem_; vector ai,bi,qi,ri,qbi,tmp0,tmp1,Wp; unsigned long l=sizeinbase2(A.size())-1; unsigned long n=1<<(l+1); while (is_greater(M,pip,context0)){ bool fourier_prime=false; for (;;){ p=p-1; if (p.type==_INT_ && sizeinbase2(p)>l+8 && n<=(1<<22)){ p=prevprimep1p2p3(p.val-1,0,n); fourier_prime=true; } else p=prevprime(p); if (smod(B0,p)!=0) break; } env->modulo=p; // check that b*q+r==a before doing division if (fourier_prime){ int m=p.val; #if 1 vecteur2vector_int(A,m,ai); vecteur2vector_int(B,m,bi); DivRem(ai,bi,m,qi,ri,rem.empty()); if (chk_equal_mod(quo,qi,m) && chk_equal_mod(rem,ri,m)){ operator_times(quo,B,0,rem_); addmodpoly(rem_,rem,rem_); // add_mulmodpoly(quo_.begin(),quo_.end(),B.begin(),B.end(),0,rem); if (rem_==A) return true; } ichinrem_inplace(quo,qi,pip,m); ichinrem_inplace(rem,ri,pip,m); pip=pip*p; continue; #endif vecteur2vector_int(quo,m,qi); vecteur2vector_int(B,m,bi); operator_times(qi,bi,m,qbi); // fft_reverse(Wp,m); vecteur2vector_int(rem,m,ri); addmod(qbi,ri,m); vecteur2vector_int(A,m,ai); #if 0 // debug tmp0.clear(); tmp0=tmp1; submod(tmp0,qbi,m); // debug if (!tmp0.empty()) CERR << "err\n"; submod(tmp1,ai,m); // debug #endif submod(qbi,ai,m); if (qbi.empty()){ operator_times(quo,B,0,rem_); addmodpoly(rem_,rem,rem_); // add_mulmodpoly(quo_.begin(),quo_.end(),B.begin(),B.end(),0,rem); if (rem_==A) return true; } else { DivRem(ai,bi,m,qi,ri); //DivRem(A,B,env,q,r,false); // debug ichinrem_inplace(quo,qi,pip,m); ichinrem_inplace(rem,ri,pip,m); } pip=pip*p; continue; } smod(A,p,a); smod(B,p,b); smod(quo,p,q); smod(rem,p,r); operator_times(b,q,env,rem_); addmodpoly(rem_,r,env,rem_); if (a==rem_){ quo_=quo; rem_=rem; } else { DivRem(a,b,env,q,r,false); quo_=ichinrem(quo,q,pip,p); rem_=ichinrem(rem,r,pip,p); } if (quo==quo_ && rem==rem_){ operator_times(quo_,B,0,rem_); addmodpoly(rem_,rem,rem_); // add_mulmodpoly(quo_.begin(),quo_.end(),B.begin(),B.end(),0,rem); if (rem_==A) return true; } quo.swap(quo_); rem.swap(rem_); pip=pip*p; } return false; } // modular division bool DivRemInt(const modpoly & A, const modpoly & B, modpoly & quo, modpoly & rem){ gen B0=B[0]; // first try for exact quotient modulo a prime gen p = p1 ; while (smod(B,p)==0){ p=prevprime(p-1); } vecteur a(A),b(B); smod(a,p,a); smod(b,p,b); environment env; env.modulo=p; env.moduloon=true; DivRem(a,b,&env,quo,rem,false); if (rem.empty()){ // it is highly probable that the division is exact, // reconstruct quo by Chinese remaindering if (divremrec(A,B,quo,rem,&env)) return true; } // reconstruct both quo and rem of the pseudo-division gen Bb=pow(B0,A.size()-B.size()+1,context0); vecteur Apseudo(A); multvecteur(Bb,Apseudo,Apseudo); multvecteur(Bb,a,a); smod(a,p,a); multvecteur(Bb,quo,quo); smod(quo,p,quo); multvecteur(Bb,rem,rem); smod(rem,p,rem); if (!divremrec(Apseudo,B,quo,rem,&env)) return false; Bb=inv(Bb,context0); multvecteur(Bb,quo,quo); multvecteur(Bb,rem,rem); return true; } int coefftype(const modpoly & v,gen & coefft){ int t=0; const_iterateur it=v.begin(),itend=v.end(); for (;it!=itend;++it){ const unsigned char tmp=it->type; if (tmp==_INT_ || tmp==_ZINT) continue; t=tmp; coefft=*it; if (t==_USER) return t; if (t==_MOD) return t; if (t==_EXT) return t; } return t; } bool DivRem(const modpoly & th, const modpoly & other, environment * env,modpoly & quo, modpoly & rem,bool allowrational){ // COUT << "DivRem" << th << "," << other << '\n'; if (other.empty()){ #ifndef NO_STDEXCEPT setsizeerr(gettext("modpoly.cc/DivRem")); #endif return false; } if (th.empty()){ quo=th; rem=th; return true ; } int a=int(th.size())-1; int b=int(other.size())-1; if (other.size()==1){ divmodpoly(th,other.front(),env,quo); rem.clear(); return true ; } quo.clear(); if (amoduloon && other.size()>FFTMUL_SIZE && th.size()-other.size()>FFTMUL_SIZE){ if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " DivRem mod start" << endl; int l=sizeinbase2(other.size()),p=env->modulo.val; if (env->modulo.type==_INT_ && p-1==((p-1)>>l)< a,b,q,r; vecteur2vector_int(th,p,a); vecteur2vector_int(other,p,b); divquores=DivQuo(a,b,p,q,true); // check for exact quotient vector_int2vecteur(q,quo); if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " DivQuo mod Fourier prime end" << endl; rem.clear(); if (divquores==2) return true; if (divquores){ operator_times(b,q,p,r); submodneg(r,a,p); vector_int2vecteur(r,rem); if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " DivRem mod Fourier prime end" << endl; return true; } } if ((divquores=DivQuo(th,other,env,quo))){ rem.clear(); if (divquores==2) return true; modpoly tmp; operator_times(other,quo,env,tmp); submodpoly(th,tmp,env,rem); return true; } } #endif if ( (env==0 || env->moduloon==false) && atype==0 && btype==0 && other.size()>FFTMUL_SIZE && th.size()-other.size()>FFTMUL_SIZE && DivRemInt(th,other,quo,rem) ) return true; quo.reserve(a-b+1); // A=BQ+R -> A=(B*invcoeff)*Q+(R*invcoeff), // make division of A*coeff by B*coeff and multiply R by coeff at the end gen coeff=other.front(),invcoeff; bool invother=false; if (coeff.type==_USER){ invother=true; invcoeff=inv(coeff,context0); } if (coeff.type==_EXT){ gen coeff0=*coeff._EXTptr; if (coeff0.type==_VECT){ for (int i=0;isize();++i){ if ((*coeff0._VECTptr)[i].type==_USER){ invcoeff=inv(coeff,context0); invother=true; break; } } } } if (!invother && env && env->moduloon){ invcoeff=invmod(coeff,env->modulo); invother=true; } // copy rem to an array modpoly::const_iterator remit=th.begin(); // ,remend=rem.end(); gen * tmp=new gen[a+1]; // must use new/delete gen * tmpend=&tmp[a]; gen * tmpptr=tmpend; // tmpend points to the highest degree coeff of A /* vecteur vtmp(a+1); iterateur tmp=vtmp.begin(); iterateur tmpend=vtmp.end()-1; iterateur tmpptr=tmpend; // tmpend points to the highest degree coeff of A */ for (;tmpptr!=tmp-1;--tmpptr,++remit) *tmpptr=*remit; modpoly::const_iterator B_beg=other.begin(),B_end=other.end(); mpz_t prod; mpz_init(prod); gen n0( 0),q,mod2(env?2*env->modulo:0); for (;a>=b;--a){ if (invother){ if (env && env->moduloon){ if (tmpend->type==_ZINT && invcoeff.type==_ZINT && env->modulo.type==_ZINT){ mpz_mul(prod,*tmpend->_ZINTptr,*invcoeff._ZINTptr); mpz_fdiv_r(prod,prod,*env->modulo._ZINTptr); // prod positive if (mpz_cmp(prod,*mod2._ZINTptr)>0) mpz_sub(prod,prod,*env->modulo._ZINTptr); q=prod; } else q=smod(*tmpend*invcoeff,env->modulo); } else q=*tmpend*invcoeff; } else { q=rdiv(*tmpend,coeff,context0); if (!allowrational){ if (q.type==_FRAC){ delete [] tmp; return false; } } } quo.push_back(q); --tmpend; bool fast=(env && is_zero(env->coeff) && (env->complexe || !env->moduloon) )?false:(q.type==_INT_) || (q.type==_ZINT); if (!is_zero(q)) { // tmp <- tmp - q *B.shifted tmpptr=tmpend; modpoly::const_iterator itq=B_beg; ++itq; // first elements cancel if (env && (env->moduloon && !env->complexe && is_zero(env->coeff)) && (env->modulo.type==_INT_) && (env->modulo.valval -= q.val*itq->val ; } } else { mpz_set_si(prod,0); for (;itq!=B_end;--tmpptr,++itq){ // no mod here to save comput. time if (fast && (tmpptr->type==_ZINT) && #ifndef SMARTPTR64 (tmpptr->__ZINTptr->ref_count==1) && #else ((ref_mpz_t *) (* (ulonglong *) tmpptr >> 16))->ref_count==1 && #endif ( (itq->type==_ZINT) || (itq->type==_INT_) ) ) sub_mul(tmpptr->_ZINTptr,prod,q,*itq); else *tmpptr = (*tmpptr)-q*(*itq) ; } } } /* if (env && !env->moduloon) { CERR << quo << '\n'; CERR << quo*other << '\n'; CERR << "["; for (int i=1;imoduloon){ for (;tmpend!=tmp-1;--tmpend){ if (tmpend->type==_ZINT && env->modulo.type==_ZINT){ mpz_fdiv_r(prod,*tmpend->_ZINTptr,*env->modulo._ZINTptr); // prod positive if (mpz_cmp_si(prod,0)) break; } else { if (!is_zero(smod(*tmpend,env->modulo))) break; } } for (;tmpend!=tmp-1;--tmpend){ if (tmpend->type==_ZINT && env->modulo.type==_ZINT){ mpz_fdiv_r(prod,*tmpend->_ZINTptr,*env->modulo._ZINTptr); // prod positive if (mpz_cmp(prod,*mod2._ZINTptr)>0) mpz_sub(prod,prod,*env->modulo._ZINTptr); rem.push_back(prod); } else rem.push_back(smod(*tmpend,env->modulo)); } } else { for (;tmpend!=tmp-1;--tmpend){ if (!is_zero(*tmpend)) break; } for (;tmpend!=tmp-1;--tmpend){ rem.push_back(*tmpend); } } mpz_clear(prod); // COUT << "DivRem" << th << "-" << other << "*" << quo << "=" << rem << " " << th-other*quo << '\n'; delete [] tmp; return true; } bool DenseDivRem(const modpoly & th, const modpoly & other,modpoly & quo, modpoly & rem,bool fastdivcheck){ int n=int(th.size()), m=int(other.size()); gen t=th[n-1], o=other[m-1]; if (fastdivcheck && n && m ){ if (is_zero(o)){ if (!is_zero(t)) return false; } else { if (!is_zero(t % o)) return false; // if ((n>1) && (m>1)) // COUT << ( th[n-2]-other[m-2]*(t/o) ) % o << '\n'; } } environment env; if (fastdivcheck){ env.moduloon=true; env.modulo=p4; bool res=DivRem(th,other,&env,quo,rem,false); if (!res || !rem.empty()) return false; } env.moduloon=false; bool res=DivRem(th,other,&env,quo,rem,false); return res; } modpoly operator / (const modpoly & th,const modpoly & other) { modpoly rem,quo; environment env; DivRem(th,other,&env,quo,rem); return quo; } modpoly operator % (const modpoly & th,const modpoly & other) { modpoly rem,quo; environment env; DivRem(th,other,&env,quo,rem); return rem; } modpoly operator_div (const modpoly & th,const modpoly & other,environment * env) { modpoly rem,quo; DivRem(th,other,env,quo,rem); return quo; } modpoly operator_mod (const modpoly & th,const modpoly & other,environment * env) { modpoly rem,quo; DivRem(th,other,env,quo,rem); return rem; } // Pseudo division a*th = other*quo + rem void PseudoDivRem(const dense_POLY1 & th, const dense_POLY1 & other, dense_POLY1 & quo, dense_POLY1 & rem, gen & a){ int ts=int(th.size()); int os=int(other.size()); if (ts>31)&p; a -= precond_mulmod31(b,q,p,qsurp); a += (a>>31)&p; return a; } // a-q1*b1-q2*b2 int precond_a_q1b1_q2b2(int a,int q1,int b1,int q2,int b2,int p,int q1surp,int q2surp){ a += (a>>31)&p; // insure a is positive b1 += (b1>>31)&p; // insure b1 is positive int t=longlong(b1)*q1-((longlong(b1)*q1surp)>>31)*p; t += (t>>31)&p; // t positive (or at least t-p is valid) a -= t; a += (a>>31)&p; // insure a is positive b2 += (b2>>31)&p; // insure b2 is positive t = longlong(b2)*q2-((longlong(b2)*q2surp)>>31)*p; t += (t>>31)&p; // t positive a -= t; return a; } // Euclidean division modulo m void DivRem(const vector & th, const vector & other,int m,vector & quo, vector & rem,bool ck_exactquo){ if (other.empty()){ rem=th; quo.clear(); return; } if (th.empty()){ quo=th; rem=th; return; } int a=int(th.size())-1; int b=int(other.size())-1; vector quo_,rem_; // debug if (b>=FFTMUL_SIZE && a-b>=FFTMUL_SIZE){ int divquores=DivQuo(th,other,m,quo,ck_exactquo); if (divquores){ rem.clear(); if (divquores==2) return; operator_times(other,quo,m,rem); submodneg(rem,th,m); return ; quo_=quo; rem_=rem; } } int coeff=other.front(),invcoeff=invmod(coeff,m); if (!b){ quo=th; mulmod(quo,invcoeff,m); rem.clear(); return; } quo.clear(); double invm=1.0/m;//find_invp(m); => chk_normalize failure if (a==b+1){ rem.clear(); // frequent case in euclidean algorithms // rem=th-other*q vector::const_iterator at=th.begin()+2,bt=other.begin()+1,btend=other.end(); #if 1 //vector rem_,quo_; { longlong q0=amodp(longlong(th[0])*invcoeff,m,invm); q0 += (q0>>63)&m; longlong q1=amodp(longlong(amodp(th[1]-other[1]*q0,m,invm) )*invcoeff,m,invm); q1 += (q1>>63)&m; quo.push_back(int(q0)); quo.push_back(int(q1)); // first part of the loop, remainder is empty, push r only if non 0 for (;;++at){ longlong r=*at-q1*(*bt); ++bt; if (bt==btend){ r=amodp(r,m,invm); if (r && r!=m && r!=-m) rem.push_back(int(r)); return; } r -= q0*(*bt); r =amodp(r,m,invm); if (r && r!=m && r!=-m){ rem.push_back(int(r)); break; } } // second part of the loop, remainder is not empty, push r always --btend; ++at; #if 1 btend-=3; int b1,b2=*bt; for (;bt>31)&m; int invcoeffinv=(1LL<<31)*invcoeff/m+1; int q0=precond_mulmod31(th[0],invcoeff,m,invcoeffinv); //if ((q0-longlong(th[0])*invcoeff)%m!=0) //CERR << "err\n"; int q0inv=(1LL<<31)*q0/m+1; int q1=precond_a_bq(th[1],other[1],q0,m,q0inv); q1=precond_mulmod31(q1,invcoeff,m,invcoeffinv); //if ((q1-(( (th[1]-other[1]*q0)%m )*invcoeff))%m!=0) //CERR << "err\n"; int q1inv=(1LL<<31)*q1/m+1; quo.push_back(int(q0)); quo.push_back(int(q1)); // first part of the loop, remainder is empty, push r only if non 0 for (--btend;bt!=btend;++at,++bt){ int r=precond_a_q1b1_q2b2(*at,q1,*bt,q0,bt[1],m,q1inv,q0inv); if (r!=0){ rem.push_back(r); ++at;++bt; break; } } for (;bt!=btend;++at,++bt){ int r=precond_a_q1b1_q2b2(*at,q1,*bt,q0,bt[1],m,q1inv,q0inv); // int s=(*at-q1*(*bt)-q0*bt[1])%m; //if ((longlong(r)-s)%m!=0) //CERR << "err\n"; rem.push_back(r); } rem.push_back(precond_a_bq(*at,*bt,q1,m,q1inv)); return; //submod(rem_,rem,m); submod(quo_,quo,m); //if (!rem_.empty() || !quo_.empty()) //CERR << "err\n"; #else longlong q0=(longlong(th[0])*invcoeff)%m; longlong q1= (( (th[1]-other[1]*q0)%m )*invcoeff)%m; quo.push_back(int(q0)); quo.push_back(int(q1)); // first part of the loop, remainder is empty, push r only if non 0 for (;;++at){ longlong r=*at-q1*(*bt); ++bt; if (bt==btend){ r %= m; if (r) rem.push_back(int(r)); return; } r -= q0*(*bt); r %= m; if (r){ rem.push_back(int(r)); break; } } // second part of the loop, remainder is not empty, push r always --btend; for (++at;bt!=btend;++at,++bt){ rem.push_back( (*at-q1*(*bt)-q0*bt[1])%m ); } rem.push_back((*at-q1*(*bt))%m); #endif return; } rem=th; // code for a-b>1 if (a::const_iterator remit=rem.begin();//,remend=rem.end(); if ((a-b+1)*double(m)*m<9e15){ ALLOCA(longlong, tmp, (a+1)*sizeof(longlong));//longlong * tmp=(longlong *)alloca((a+1)*sizeof(longlong)); longlong * tmpend=&tmp[a]; longlong * tmpptr=tmpend; // tmpend points to the highest degree coeff of A for (;tmpptr!=tmp-1;--tmpptr,++remit) *tmpptr=*remit; vector::const_iterator B_beg=other.begin(),B_end=other.end(); int q;//n0(0), for (;a>=b;--a){ q= amodp(longlong(invcoeff)*(*tmpend),m,invm); quo.push_back(q); --tmpend; // tmp <- tmp - q *B.shifted (if q!=0) if (q) { tmpptr=tmpend; vector::const_iterator itq=B_beg; ++itq; // first elements cancel for (;itq!=B_end;--tmpptr,++itq){ *tmpptr = (*tmpptr -(longlong(q) * (*itq))); } } } // trim rem and multiply by coeff, this will modularize rem as well rem.clear(); // bool trimming=true; for (;tmpend!=tmp-1;--tmpend){ if (*tmpend && *tmpend % m) break; } for (;tmpend!=tmp-1;--tmpend){ rem.push_back( amodp(*tmpend,m,invm)); } return; } #if defined VISUALC || defined BESTA_OS int * tmp=new int[a+1]; #else int tmp[a+1]; #endif int * tmpend=&tmp[a]; int * tmpptr=tmpend; // tmpend points to the highest degree coeff of A for (;tmpptr!=tmp-1;--tmpptr,++remit) *tmpptr=*remit; vector::const_iterator B_beg=other.begin(),B_end=other.end(); int q;//n0(0), for (;a>=b;--a){ //q = longlong(invcoeff)*(*tmpend) % m; q = amodp(longlong(invcoeff)*(*tmpend),m,invm); //q += (q>>31)&m; quo.push_back(q); --tmpend; // tmp <- tmp - q *B.shifted (if q!=0) if (q) { tmpptr=tmpend; vector::const_iterator itq=B_beg; ++itq; // first elements cancel for (;itq!=B_end;--tmpptr,++itq){ *tmpptr = amodp(*tmpptr -(longlong(q) * (*itq)),m,invm); //*tmpptr=(*tmpptr -(longlong(q) * (*itq)))%m; } } } // trim rem and multiply by coeff, this will modularize rem as well rem.clear(); // bool trimming=true; for (;tmpend!=tmp-1;--tmpend){ if (*tmpend && (*tmpend % m)) break; } for (;tmpend!=tmp-1;--tmpend){ //int r=*tmpend %m; int r=amodp(*tmpend,m,invm); //r += (r>>31)&m; rem.push_back(r); } #if defined VISUALC || defined BESTA_OS delete [] tmp; #endif return; // debug if (quo_.size()){ submod(quo_,quo,m); submod(rem_,rem,m); if (quo_.size() || rem_.size()) CERR << "err\n"; } } // Conversion from vector to vector modulo m void modpoly2smallmodpoly(const modpoly & p,vector & v,int m){ v.clear(); const_iterateur it=p.begin(),itend=p.end(); v.reserve(itend-it); int g; bool trim=true; for (;it!=itend;++it){ if (it->type==_INT_) g=it->val % m; else g=smod(*it,m).val; if (g) trim=false; if (!trim) v.push_back(g); } } // Conversion from vector to vector using smod void smallmodpoly2modpoly(const vector & v,modpoly & p,int m){ vector::const_iterator it=v.begin(),itend=v.end(); p.clear(); p.reserve(itend-it); for (;it!=itend;++it){ p.push_back(smod(*it,m)); } } // compute r mod b into r // r, b must be allocated arrays of int // compute quotient if quoend!=0 // set exactquo to true if you know that b divides r and only want to compute the quotient // this will not compute low degree coeff of r during division and spare some time static void rem(int * & r,int *rend,int * b,int *bend,int m,int * & quo,int *quoend,bool exactquo=false){ int * i,*j,*rstop,*qcur,k,q,q2,lcoeffinv=1; k=int(bend-b); if (!k){ quo=quoend; return; } if (rend-r=degree(b) do r <- r - r[0]*lcoeffinv*b // rend is not used anymore, we make it point k ints before rstop = rend-(k-1) ; // if r==rend then deg(r)==deg(b) for (;rstop-r>0;){ type_operator_times_reduce(*r,lcoeffinv,q,m); // q=((*r)*longlong(lcoeffinv))%m; if (quoend){ *qcur=q; ++qcur; } ++r; if (q){ q=-q; j=r; i=b; for (;i!=bend;++j,++i){ type_operator_plus_times_reduce_nock(q,*i,*j,m); // *j = (*j + q * *i)%m; } } if (exactquo && rend-r<=2*(k-1)) --bend; } } // trim answer for (;r!=rend;++r){ if (*r) break; } } /* void rem_tabint(int * & r,int *rend,int * b,int *bend,int m,int * & quo,int *quoend){ int * i,*j,*rstop,*qcur,k,q,lcoeffinv=1; k=bend-b; if (!k){ quo=quoend; return; } if (rend-r=degree(b) do r <- r - r[0]*lcoeffinv*b // rend is not used anymore, we make it point k ints before rstop = rend-(k-1) ; // if r==rend then deg(r)==deg(b) for (;rstop-r>0;){ type_operator_times_reduce(*r,lcoeffinv,q,m); // q=((*r)*longlong(lcoeffinv))%m; if (quoend){ *qcur=q; ++qcur; } ++r; if (q){ q=-q; j=r; i=b; for (;i!=bend;++j,++i){ // type_operator_plus_times_reduce_nock(q,*i,*j,m); *j = (*j + q * *i)%m; // *j = (*j + longlong(q) * *i)%m; } } } // trim answer for (;r!=rend;++r){ if (*r) break; } } */ static void gcdconvert(const modpoly & p,int m,int * a){ const_iterateur it=p.begin(),itend=p.end(); for (;it!=itend;++it,++a){ if (it->type==_INT_) *a=it->val % m; else *a=smod(*it,m).val; } } static bool gcdconvert(const polynome & p,int m,int * a){ vector< monomial >::const_iterator it=p.coord.begin(),itend=p.coord.end(); int deg; for (;it!=itend;){ if (it->value.type==_INT_) *a=it->value.val % m; else { if (it->value.type==_ZINT) *a=smod(it->value,m).val; else return false; } deg=it->index.front(); ++it; if (it==itend){ for (++a;deg>0;++a,--deg){ *a=0; } return true; } deg -= it->index.front(); for (++a,--deg;deg>0;++a,--deg){ *a=0; } } return true; } // Efficient small modular gcd of p and q using vector void gcdsmallmodpoly(const modpoly &p,const modpoly & q,int m,modpoly & d){ int as=int(p.size()),bs=int(q.size()); #if defined VISUALC || defined BESTA_OS int *asave=new int[as], *a=asave,*aend=a+as; int *bsave=new int[bs], *b=bsave,*bend=b+bs,*qcur=0; #else #ifndef NO_STDEXCEPT if (as>1000000 || bs>1000000) setdimerr(); #endif int asave[as], *a=asave,*aend=a+as; int bsave[bs], *b=bsave,*bend=b+bs,*qcur=0; #endif gcdconvert(p,m,a); int * t; gcdconvert(q,m,b); for (;b!=bend;){ rem(a,aend,b,bend,m,qcur,0); t=a; a=b; b=t; t=aend; aend=bend; bend=t; } d.clear(); d.reserve(aend-a); int ainv=1; if (a!=aend) ainv=invmod(*a,m); for (;a!=aend;++a){ d.push_back(smod((*a)*longlong(ainv),m)); } #if defined VISUALC || defined BESTA_OS delete [] asave; delete [] bsave; #endif } bool gcdsmallmodpoly(const polynome &p,const polynome & q,int m,polynome & d,polynome & dp,polynome & dq,bool compute_cof){ if (p.dim!=1 || q.dim!=1) return false; bool promote = m>=46340; int as=p.lexsorted_degree()+1,bs=q.lexsorted_degree()+1; if (as>HGCD*4 || bs>HGCD*4) return false; #if defined VISUALC || defined BESTA_OS int *asave = new int[as], *a=asave,*aend=a+as,*qcur=0; int *Asave = new int[as], *A=Asave,*Aend=A+as; int *bsave = new int[bs], *b=bsave,*bend=b+bs; int *Bsave = new int[bs], *B=Bsave,*Bend=B+bs; #else // this will allocate too much on stack for as+bs large int asave[as], *a=asave,*aend=a+as,*qcur=0; int Asave[as], *A=Asave,*Aend=A+as; int bsave[bs], *b=bsave,*bend=b+bs; int Bsave[bs], *B=Bsave,*Bend=B+bs; #endif int * t; if (gcdconvert(p,m,a) && gcdconvert(q,m,b) ){ memcpy(Asave,asave,as*sizeof(int)); memcpy(Bsave,bsave,bs*sizeof(int)); for (;b!=bend;){ rem(a,aend,b,bend,m,qcur,0); t=a; a=b; b=t; t=aend; aend=bend; bend=t; } d.coord.clear(); int ainv=1; int * aa=a; if (a!=aend) ainv=invmod(*a,m); if (promote){ for (int deg=int(aend-a)-1;a!=aend;++a,--deg){ if (*a){ *a=smod((*a)*longlong(ainv),m); d.coord.push_back(monomial(*a,deg,1,1)); } } } else { for (int deg=int(aend-a)-1;a!=aend;++a,--deg){ if (*a){ *a=smod((*a)*ainv,m); d.coord.push_back(monomial(*a,deg,1,1)); } } } if (aa!=aend && compute_cof){ if (debug_infolevel>20) CERR << "gcdsmallmodpoly, compute cofactors " << CLOCK() << '\n'; #if defined VISUALC || defined BESTA_OS int * qsave=new int[std::max(as,bs)], *qcur=qsave,*qend=qsave+std::max(as,bs); #else int qsave[std::max(as,bs)], *qcur=qsave,*qend=qsave+std::max(as,bs); #endif // int * qsave=new int[as], *qcur=qsave,*qend=qsave+as; rem(A,Aend,aa,aend,m,qcur,qend); dp.coord.clear(); for (int deg=int(qend-qcur)-1;qcur!=qend;++qcur,--deg){ if (*qcur) dp.coord.push_back(monomial(smod(*qcur,m),deg,1,1)); } qcur=qsave; rem(B,Bend,aa,aend,m,qcur,qend); dq.coord.clear(); for (int deg=int(qend-qcur)-1;qcur!=qend;++qcur,--deg){ if (*qcur) dq.coord.push_back(monomial(smod(*qcur,m),deg,1,1)); } if (debug_infolevel>20) CERR << "gcdsmallmodpoly, end compute cofactors " << CLOCK() << '\n'; #if defined VISUALC || defined BESTA_OS delete [] qsave; #endif } #if defined VISUALC || defined BESTA_OS delete [] asave; delete [] Asave; delete [] bsave; delete [] Bsave; #endif return true; } else { #if defined VISUALC || defined BESTA_OS delete [] asave; delete [] Asave; delete [] bsave; delete [] Bsave; #endif return false; } } // invert a1 mod m double invmod(double a1,double A){ double a(A),a2,u=0,u1=1,u2,q; for (;a1;){ q=std::floor(a/a1); a2=a-q*a1; u2=u-q*u1; a=a1; a1=a2; u=u1; u1=u2; } if (a==-1){ a=1; u=-u; } if (a!=1) return 0; if (u<0) u+=A; return u; } bool convertdouble(const modpoly & p,double M,vector & v){ v.clear(); v.reserve(p.size()); int m=int(M); const_iterateur it=p.begin(),itend=p.end(); for (;it!=itend;++it){ if (it->type==_INT_) v.push_back(it->val % m); else { if (it->type==_ZINT) v.push_back(smod(*it,m).val); else return false; } } return true; } bool convertfromdouble(const vector & A,modpoly & a,double M){ a.clear(); a.reserve(A.size()); int m( (int)M); vector::const_iterator it=A.begin(),itend=A.end(); for (;it!=itend;++it){ double d=*it; if (d!=int(d)) return false; if (d>M/2) a.push_back(int(d)-m); else a.push_back(int(d)); } return true; } void multdoublepoly(double x,vector & v,double m){ if (x==1) return; vector::iterator it=v.begin(),itend=v.end(); for (;it!=itend;++it){ double t=*it * x; double q=std::floor(t/m); *it = t-q*m; } } // A = BQ+R mod m with B leading coeff = 1 void quoremdouble(const vector & A,const vector & B,vector & Q,vector & R,double m){ Q.clear(); R=A; int rs=int(R.size()),bs=int(B.size()); if (rs::iterator it=R.begin(),itend=it+(rs-bs+1); for (;it!=itend;){ double q=*it; Q.push_back(q); *it=0; ++it; vector::iterator kt=it; vector::const_iterator jt=B.begin()+1,jtend=B.end(); for (;jt!=jtend;++kt,++jt){ double d= *kt- q*(*jt); *kt=d-std::floor(d/m)*m; } for (;it!=itend;++it){ if (*it) break; } } for (;it!=R.end();++it){ if (*it) break; } R.erase(R.begin(),it); } bool gcddoublemodpoly(const modpoly &p,const modpoly & q,double m,modpoly &a){ vector A,B,Q,R; if (!convertdouble(p,m,A) || !convertdouble(q,m,B)) return false; while (!B.empty()){ multdoublepoly(invmod(B.front(),m),B,m); quoremdouble(A,B,Q,R,m); swap(A,B); swap(B,R); } if (!A.empty()) multdoublepoly(invmod(A.front(),m),A,m); return convertfromdouble(A,a,m); } void reverse_resize(modpoly & a,int N,int reserve){ reverse(a.begin(),a.end()); // for (int i=a.size();i & a,int N,int p){ a.clear(); a.resize(N); if (source.empty()) return; const gen * stop=&*source.begin(),*start=&*source.end()-1; int i=0; for (;i=stop;i++,--start){ if (start->type==_INT_) a[i]=start->val % p; else a[i]=modulo(*start->_ZINTptr,p); } for (i=0;start>=stop;--start){ if (start->type==_INT_) a[i]=(a[i]+longlong(start->val)) %p; else a[i]=(a[i]+longlong(modulo(*start->_ZINTptr,p))) % p; ++i; if (i==N) i=0; } } // make f coeffs in [0,p] void make_positive(vector & f,int p){ for (vector::iterator it=f.begin();it!=f.end();++it){ int i=*it; i += (i>>31)&p; i -= p; i += (i>>31)&p; *it=i; } } void reverse_assign(vector & a,int N,int p){ if (a.size()>N){ vector::iterator it=a.begin(),jt=it+N,jtend=a.end(); for (;it>31)&p; for (it=a.begin();jt!=jtend;++it,++jt){ int i=*it,j=*jt; j += (j>>31)&p; i += j-p; i += (i>>31)&p; *jt=i; } a.erase(a.begin(),it); reverse(a.begin(),a.end()); } else { make_positive(a,p); reverse(a.begin(),a.end()); a.resize(N); } } // a=source mod x^N-1 mod p void reverse_assign(const vector & source,vector & a,int N,int p){ a.clear(); a.resize(N); if (source.empty()) return; const int * stop=&*source.begin(),*start=&*source.end()-1; int i=0; for (;i=stop;i++,--start){ int k=*start; k += (k>>31)&p; // add p if k is negative // if (k<0) //CERR << "err\n"; a[i]=k; } for (i=0;start>=stop;--start){ int k=*start; k -= (k>>31)*p; k += (a[i]-p); k -= (k>>31)*p; a[i]= k ; // a[i]=(a[i]+longlong(*start)) %p; // if ( (a[i]-longlong(k))%p!=0) //if (k<0) //CERR << "err\n"; ++i; if (i==N) i=0; } } // a=source mod x^N-1 void reverse_assign(const modpoly & source,modpoly & a,int N,int reserve){ if (&source==&a){ a.reserve(N); reverse(a.begin(),a.end()); for (int i=0;i=stop;i++,--start){ if (a[i].type!=_ZINT){ a[i]=0; a[i].uncoerce(reserve); } if (start->type==_INT_) mpz_set_si(*a[i]._ZINTptr,start->val); else mpz_set(*a[i]._ZINTptr,*start->_ZINTptr); } for (;i=stop;--start){ if (start->type==_INT_){ if (start->val>=0) mpz_add_ui(*a[i]._ZINTptr,*a[i]._ZINTptr,start->val); else mpz_sub_ui(*a[i]._ZINTptr,*a[i]._ZINTptr,-start->val); } else mpz_add(*a[i]._ZINTptr,*a[i]._ZINTptr,*start->_ZINTptr); ++i; if (i==N) i=0; } } void fft_ab_p1(vector &a,const vector &b){ size_t s=a.size(); for (size_t i=0;i &a,const vector &b){ size_t s=a.size(); for (size_t i=0;i &a,const vector &b){ size_t s=a.size(); for (size_t i=0;i & ua,const vector & q,const vector &ub,vector & ur,int p){ double invp=find_invp(p); longlong q1=-q[0],q0=-q[1]; ur.clear(); ur.push_back((q1*ub.front())%p); const int * it=&ub[0],*itend=it-1+ub.size(),*itmid=it+ub.size()-ua.size(),*jt=&ua[0]; if (ua.empty()){ for (;it!=itend;++it){ ur.push_back(amodp(q0*it[0]+q1*it[1],p,invp)); } ur.push_back(amodp(q0*it[0],p,invp)); } else { #if 1 itmid-=4; int i0=it[0],i1; for (;it & ua,const vector& q,const vector &ub,vector & ur,int p,int & q0inv,int & q1inv){ //if (ua.empty()) return a_minus_qsize2_b(ua,q,ub,ur,p); int q1=q[0],q0=q[1]; if (q0inv==0 || q1inv==0){ q0 += (q0>>31)&p; q1 += (q1>>31)&p; q0inv=(1ULL<<31)*unsigned(q0)/unsigned(p)+1; q1inv=(1ULL<<31)*unsigned(q1)/unsigned(p)+1; } ur.clear(); ur.push_back(precond_mulmod31(-ub.front(),q1,p,q1inv)); // (-q1*ub.front())%p); const int * it=&ub[0],*itend=it-1+ub.size(),*itmid=it+ub.size()-ua.size(),*jt=&ua[0]; for (;it!=itmid;++it){ ur.push_back(precond_a_q1b1_q2b2(0,q0,it[0],q1,it[1],p,q0inv,q1inv)); } for (;it!=itend;++jt,++it){ ur.push_back(precond_a_q1b1_q2b2(*jt,q0,it[0],q1,it[1],p,q0inv,q1inv)); } ur.push_back(precond_a_bq(*jt,it[0],q0,p,q0inv));//(*jt-q0*it[0])%p); } bool hgcd_iter_int(const vector & a0i,const vector & b0i,int m,vector & ua,vector & ub,vector & va,vector &vb,int p,vector & coeffv,vector & degv,vector &a,vector & b,vector & q,vector & r,vector & ur,vector & vr){ if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " halfgcd iter m=" << m << " dega0/a1 " << a0i.size() << "," << b0i.size() << '\n'; int as=a0i.size(),as2=nextpow2(as); a.reserve(as2); b.reserve(as2); a.resize(a0i.size()); b.resize(b0i.size()); copy(a0i.begin(),a0i.end(),a.begin()); copy(b0i.begin(),b0i.end(),b.begin()); r.reserve(as); // initializes ua to 1 and ub to 0, the coeff of u in ua*a+va*b=a ua.reserve(as2); ua.clear(); ua.push_back(1); ub.clear(); ub.reserve(as2); ur.clear(); ur.reserve(as2); va.reserve(as2); va.clear(); vb.clear(); vb.reserve(as2); vb.push_back(1); vr.clear(); vr.reserve(as2); vector::iterator it,itend; // DivRem: a = bq+r // hence ur <- ua-q*ub, vr <- va-q*vb verify // ur*a+vr*b=r // a <- b, b <- r, ua <- ub and ub<- ur for (;;){ int n=int(b.size())-1; if (n2) CERR << CLOCK()*1e-6 << " halfgcd iter end" << a0i.size() << "," << b0i.size() << '\n'; make_positive(ua,p); make_positive(ub,p); make_positive(va,p); make_positive(vb,p); return true; } if (!degv.empty()){ degv.push_back(degv.back()+b.size()-a.size()); coeffv.push_back(b[0]); } DivRem(a,b,p,q,r); // division works always swap(a,b); swap(b,r); // a=b; b=r; // ur=ua-q*ub, ua<-ub, ub<-ur if (q.size()==2){ // here ua.size()val)%p); } ur.push_back((q0*it[0].val+jt->val)%p); } } void a_bc(const vector &a,const vector &b,const vector &c,int p,vector & res,vector & tmp1){ // res=trim(a-b*c,env); return; size_t as=a.size(),bs=b.size(); if (as<=bs){ tmp1.clear(); tmp1.reserve(bs); if (c.size()==2){ a_minus_qsize2_b(a,c,b,tmp1,p); tmp1.swap(res); //make_positive(res,p); return; } } mulsmall(b.begin(),b.end(),c.begin(),c.end(),p,tmp1); submodneg(tmp1,a,p); tmp1.swap(res); } // a-b*c void a_bc(const modpoly &a,const modpoly &b,const modpoly &c,environment * env,modpoly & res,modpoly & tmp1){ // res=trim(a-b*c,env); return; size_t as=a.size(),bs=b.size(); if (as<=bs && env->moduloon && env->modulo.type==_INT_){ tmp1.clear(); tmp1.reserve(bs); int p=env->modulo.val; if (c.size()==2){ a_minus_qsize2_b(a,c,b,tmp1,p); tmp1.swap(res); return; } } environment zeroenv; tmp1.clear(); if (!b.empty() && !c.empty()) operator_times(b,c,&zeroenv,tmp1); submodpoly(a,tmp1,res); trim_inplace(res,env); } void smod2N(mpz_t & z,unsigned long expoN,mpz_t & tmpqz,bool do_smod=false){ mpz_tdiv_q_2exp(tmpqz,z,expoN); if (mpz_cmp_si(tmpqz,0)){ mpz_tdiv_r_2exp(z,z,expoN); mpz_sub(z,z,tmpqz); mpz_tdiv_q_2exp(tmpqz,z,expoN); if (mpz_cmp_si(tmpqz,0)){ mpz_tdiv_r_2exp(z,z,expoN); mpz_sub(z,z,tmpqz); } } if (!do_smod) return; mpz_tdiv_q_2exp(tmpqz,z,expoN-1); if (mpz_cmp_si(tmpqz,0)){ mpz_sub(z,z,tmpqz); mpz_mul_2exp(tmpqz,tmpqz,expoN); mpz_sub(z,z,tmpqz); } } void trim_deg(modpoly & a,int deg){ if (a.size()>deg+1) a.erase(a.begin(),a.end()-deg-1); } void trim_deg(vector & a,int deg){ if (a.size()>deg+1) a.erase(a.begin(),a.end()-deg-1); } void trim_deg(vector & a,int deg){ if (a.size()>deg+1) a.erase(a.begin(),a.end()-deg-1); } #ifdef INT128 #define GIAC_LLPRECOND 1 inline longlong precond_mulmodll(ulonglong A,ulonglong W,ulonglong Winvp,ulonglong p){ longlong t = uint128_t(A)*W-((uint128_t(A)*Winvp)>>64)*p; t+=((t>>63)&p); return t; // debug if ((uint128_t(A)*W-t)%p!=0) CERR << "err\n"; return t; } inline ulonglong preconditionner_ll(ulonglong ww,longlong p){ return 1+((uint128_t(1)<<64)*ww)/ulonglong(p); // quotient ceiling } longlong smodll(int128_t res,longlong m){ res %= m; if (res>m/2) res -= m; return res; } // this does not work for 63 bits primes because long_double // aka float128 seems to be FPU 80 bits integers with 64 bits of mantissa // insufficent precision inline longlong amodpll(int128_t a,longlong p,long_double invp){ longlong q=long_double(a)*invp; q=a-int128_t(q)*p; q+=(q>>63)&p;q+=(q>>63)&p; q-=p;q+=(q>>63)&p; return q; // debug if (q!=q%p) CERR << "err amodpll\n"; return q%p; } #if !defined USE_GMP_REPLACEMENTS && !defined BF2GMP_H void vecteur2vector_ll(const vecteur & v,longlong m,vector & res){ vecteur::const_iterator it=v.begin(),itend=v.end(); res.clear(); res.reserve(itend-it); if (m<0) m=-m; for (;it!=itend;++it){ gen g=*it; if (it->type==_MOD) g=*it->_MODptr; longlong r=it->type==_ZINT?mpz_fdiv_ui(*it->_ZINTptr,m):(it->val % m); r += (ulonglong(r)>>63)*m; // make positive // r -= (ulonglong((m>>1)-r)>>31)*m; // smod res.push_back(r); } } #endif // longlong fft // exemple of Fourier primes (with 2^53-roots of unity) // [4719772409484279809,4782822804267466753,4854880398305394689,5071053180419178497,5179139571476070401,5323254759551926273,5395312353589854209,5503398744646746113,5998794703657500673,6151917090988097537,6269010681299730433,6566248256706183169,6782421038819966977,6962565023914786817,7097673012735901697,7557040174727692289,7728176960567771137,7908320945662590977,8295630513616453633,8583860889768165377,8592868089022906369,8691947280825057281,9097271247288401921] const longlong p5=9097271247288401921LL; const long_double invp5=long_double(1)/p5; static inline longlong addmodll(longlong a, longlong b, longlong p) { longlong t=(a-p)+b; t += (t>>63)&p; return t; } static inline longlong submodll(longlong a, longlong b, longlong p) { longlong t=a-b; t += (t>>63)&p; return t; } static inline longlong mulmodll(longlong a, longlong b, longlong p) { return (int128_t(a)*b) % p; } void mulmodll(vector & v,longlong b,longlong p){ vector::iterator it=v.begin(),itend=v.end(); int128_t B=b; for (;it!=itend;++it){ *it=(*it*B)%p; } } static inline longlong mulmodll(longlong a, longlong b, longlong p,long_double invp) { return amodpll(int128_t(a)*b,p,invp); } void mulmodll(vector & v,longlong b,longlong p,long_double invp){ vector::iterator it=v.begin(),itend=v.end(); for (;it!=itend;++it){ *it=mulmodll(*it,b,p,invp); // *it=(*it*int128_t(B))%p; } } void precond_mulmodll(vector & v,longlong b,longlong bsurp,longlong p){ vector::iterator it=v.begin(),itend=v.end(); for (;it!=itend;++it){ *it=precond_mulmodll(*it,b,bsurp,p); } } // Euclidean division modulo m void DivRem(const vector & th, const vector & other,longlong m,vector & quo, vector & rem){ if (other.empty()){ rem=th; quo.clear(); return; } if (th.empty()){ quo=th; rem=th; return; } longlong a=longlong(th.size())-1; longlong b=longlong(other.size())-1; longlong coeff=other.front(),invcoeff=invmodll(coeff,m); long_double invm=long_double(1)/m; if (!b){ quo=th; mulmodll(quo,invcoeff,m); rem.clear(); return; } quo.clear(); if (a==b+1){ rem.clear(); // frequent case in euclidean algorithms int128_t q0=amodpll(int128_t(th[0])*invcoeff,m,invm); if (q0<0) q0+=m; int128_t q1=amodpll(int128_t(amodpll(th[1]-other[1]*q0,m,invm) )*invcoeff,m,invm);// (( (th[1]-other[1]*q0)%m )*invcoeff)%m; if (q1<0) q1+=m; quo.push_back(longlong(q0)); quo.push_back(longlong(q1)); // rem=th-other*q vector::const_iterator at=th.begin()+2,bt=other.begin()+1,btend=other.end(); // first part of the loop, remainder is empty, push r only if non 0 for (;;++at){ int128_t r=*at-q1*(*bt); ++bt; if (bt==btend){ r =amodpll(r,m,invm); if (r&& r!=m && r!=-m) rem.push_back(longlong(r)); return; } r -= q0*(*bt); r = amodpll(r,m,invm); if (r&& r!=m && r!=-m){ rem.push_back(longlong(r)); break; } } // second part of the loop, remainder is not empty, push r always for (++at;;++at){ int128_t r=*at-q1*(*bt); ++bt; if (bt==btend){ rem.push_back(amodpll(r,m,invm)); return; } rem.push_back(amodpll(r-q0*(*bt),m,invm));//rem.push_back((r-q0*(*bt))%m); } } rem=th; if (a A*invcoeff=(B*invcoeff)*Q+(R*invcoeff), // make division of A*invcoeff by B*invcoeff and multiply R by coeff at the end // copy rem to an array vector::const_iterator remit=rem.begin();//,remend=rem.end(); #if defined VISUALC || defined BESTA_OS longlong * tmp=new longlong[a+1]; #else longlong tmp[a+1]; #endif longlong * tmpend=&tmp[a]; longlong * tmpptr=tmpend; // tmpend points to the highest degree coeff of A for (;tmpptr!=tmp-1;--tmpptr,++remit) *tmpptr=*remit; vector::const_iterator B_beg=other.begin(),B_end=other.end(); longlong q;//n0(0), for (;a>=b;--a){ q= amodpll(int128_t(invcoeff)*(*tmpend),m,invm); quo.push_back(q); --tmpend; // tmp <- tmp - q *B.shifted (if q!=0) if (q) { tmpptr=tmpend; vector::const_iterator itq=B_beg; ++itq; // first elements cancel for (;itq!=B_end;--tmpptr,++itq){ *tmpptr = amodpll(*tmpptr -(int128_t(q) * (*itq)),m,invm); // (*tmpptr -(int128_t(q) * (*itq)))%m; } } } // trim rem and multiply by coeff, this will modularize rem as well rem.clear(); // bool trimming=true; for (;tmpend!=tmp-1;--tmpend){ if (*tmpend && *tmpend % m) break; } for (;tmpend!=tmp-1;--tmpend){ rem.push_back(*tmpend); } #if defined VISUALC || defined BESTA_OS delete [] tmp; #endif } void smallmultll(const vector & a,const vector & b,vector & new_coord,longlong modulo){ int128_t test=int128_t(modulo)*std::min(a.size(),b.size()); bool large=test/(1ULL<<63) > (1ULL<<63)/modulo; new_coord.clear(); if (a.empty() || b.empty()) return; vector::const_iterator ita_begin=a.begin(),ita=a.begin(),ita_end=a.end(),itb=b.begin(),itb_end=b.end(); for ( ; ita!=ita_end; ++ita ){ vector::const_iterator ita_cur=ita,itb_cur=itb; if (large){ longlong res=0; for (;itb_cur!=itb_end;--ita_cur,++itb_cur) { res = (res + *ita_cur * int128_t(*itb_cur))%modulo ; if (ita_cur==ita_begin) break; } new_coord.push_back(res % modulo); } else { int128_t res=0; for (;itb_cur!=itb_end;--ita_cur,++itb_cur) { res += *ita_cur * int128_t(*itb_cur) ; if (ita_cur==ita_begin) break; } new_coord.push_back(res % modulo); } } --ita; ++itb; for ( ; itb!=itb_end;++itb){ vector::const_iterator ita_cur=ita,itb_cur=itb; if (large){ longlong res=0; for (;;) { res = (res + *ita_cur * int128_t(*itb_cur))%modulo ; if (ita_cur==ita_begin) break; --ita_cur; ++itb_cur; if (itb_cur==itb_end) break; } new_coord.push_back( res % modulo); } else { int128_t res= 0; for (;;) { res += *ita_cur * int128_t(*itb_cur) ; if (ita_cur==ita_begin) break; --ita_cur; ++itb_cur; if (itb_cur==itb_end) break; } new_coord.push_back(res % modulo); } } } void a_minus_qsize2_b(const vector & ua,const vector & q,const vector &ub,vector & ur,longlong p){ ur.clear(); int128_t q1=-q[0],q0=-q[1]; long_double invp=long_double(1)/p; ur.push_back(amodpll(q1*ub.front(),p,invp)); const longlong * it=&ub[0],*itend=it-1+ub.size(),*itmid=it+ub.size()-ua.size(),*jt=&ua[0]; if (ua.empty()){ for (;it!=itend;++it){ ur.push_back(amodpll(q0*it[0]+q1*it[1],p,invp)); } ur.push_back(amodpll(q0*it[0],p,invp)); } else { #if 1 itmid-=4; longlong i0=it[0],i1; for (;it & v,const vector & w,longlong m){ vector::iterator it=v.begin(),itend=v.end(); vector::const_iterator jt=w.begin(),jtend=w.end(); longlong addv=longlong(jtend-jt)-longlong(itend-it); if (addv>0){ v.insert(v.begin(),addv,0); it=v.begin(); itend=v.end(); } else { itend -= jtend-jt; for (;it!=itend;++it) *it = -*it; itend += jtend-jt; } for (;it!=itend;++jt,++it){ longlong a=*it,b=*jt; a += (a>>63)&m; b += (b>>63)&m; *it = b-a; } for (it=v.begin();it!=itend;++it){ if (*it) break; } if (it!=v.begin()) v.erase(v.begin(),it); } bool hgcd_iter_ll(const vector & a0i,const vector & b0i,longlong m,vector & ua,vector & ub,vector & va,vector &vb,longlong p,vector & coeffv,vector & degv,vector &a,vector & b,vector & q,vector & r,vector & ur,vector & vr){ if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " halfgcd iter m=" << m << " dega0/a1 " << a0i.size() << "," << b0i.size() << '\n'; longlong as=a0i.size(); a.resize(a0i.size()); b.resize(b0i.size()); copy(a0i.begin(),a0i.end(),a.begin()); copy(b0i.begin(),b0i.end(),b.begin()); r.reserve(as); // initializes ua to 1 and ub to 0, the coeff of u in ua*a+va*b=a ua.reserve(as); ua.clear(); ua.push_back(1); ub.clear(); ub.reserve(as); ur.clear(); ur.reserve(as); va.reserve(as); va.clear(); vb.clear(); vb.reserve(as); vb.push_back(1); vr.clear(); vr.reserve(as); vector::iterator it,itend; // DivRem: a = bq+r // hence ur <- ua-q*ub, vr <- va-q*vb verify // ur*a+vr*b=r // a <- b, b <- r, ua <- ub and ub<- ur #if 1 for (;;){ int n=int(b.size())-1; if (n2) CERR << CLOCK()*1e-6 << " halfgcd iter end" << a0i.size() << "," << b0i.size() << '\n'; return true; } if (!degv.empty()){ degv.push_back(degv.back()+b.size()-a.size()); coeffv.push_back(b[0]); } DivRem(a,b,p,q,r); // division works always swap(a,b); swap(b,r); // a=b; b=r; // ur=ua-q*ub, ua<-ub, ub<-ur if (q.size()==2){ // here ua.size()2) CERR << CLOCK()*1e-6 << " halfgcd iter compute v " << a0i.size() << "," << b0i.size() << '\n'; // va=(a-ua*a0i)/b0i smallmultll(ua,a0i,ur,p); submodnegll(ur,a,p); DivRem(ur,b0i,p,va,r); // shoud be va // vb=(b-ub*a0i)/b0i smallmultll(ub,a0i,ur,p); submodnegll(ur,b,p); DivRem(ur,b0i,p,vb,r); // should be vb if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " halfgcd iter end" << a0i.size() << "," << b0i.size() << '\n'; //CERR << a0 << " " << a1 << " " << A << " " << B << " " << C << " " << D << '\n'; return true; } if (!degv.empty()){ degv.push_back(degv.back()+b.size()-a.size()); coeffv.push_back(b[0]); } DivRem(a,b,p,q,r); // division works always swap(a,b); swap(b,r); // a=b; b=r; // ur=ua-q*ub, ua<-ub, ub<-ur if (ub.empty()){ swap(ua,ub); continue; } if (q.size()==2){ // here ua.size()a;++a,--b){ longlong tmp=*a; *a=p-*b; *b=p-tmp; } if (a==b) *a=p-*a; } void fft_reverse(vector & W,longlong p){ if (W.size()<2) return; longlong * a=&W.front(); #ifdef GIAC_LLPRECOND longlong N=W.size()/2; fft_rev1(a+1,a+N-1,p); fft_rev1(a+N+1,a+2*N-1,1); #else fft_rev1(a+1,a+W.size()-1,p); #endif } #ifdef GIAC_LLPRECOND // preconditionned void fft2wp(vector & W,longlong n,longlong w,longlong p){ W.resize(n); w=w % p; if (w<0) w += p; longlong N=n/2; ulonglong ww=1; for (longlong i=0;i & W,longlong n,longlong w,longlong p){ W.reserve(n/2); long_double invp=long_double(1)/p; w=amodpll(w,p,invp);//w % p; if (w<0) w += p; longlong N=n/2,ww=1; for (longlong i=0;i>63)&p; } } #endif void fft2wp5(vector & W,longlong n,longlong w){ W.reserve(n/2); w=w % p5; if (w<0) w += p5; longlong N=n/2,ww=1; for (longlong i=0;i>63)&p;if ((t-t1)%p!=0) // CERR << "err\n"; A = addmodll(s,t,p); An2 = submodll(s,t,p); } inline void fft_loop_p(longlong & A,longlong & An2,longlong W,longlong Winv,longlong p){ longlong s=A; longlong t=precond_mulmodll(An2,W,Winv,p); //longlong t1=mulmodll(*W,An2,p,invp); t1+=(t1>>63)&p;if ((t-t1)%p!=0) // CERR << "err\n"; A = addmodll(s,t,p); An2 = submodll(s,t,p); } #else inline void fft_loop_p(longlong & A,longlong & An2,longlong * W,longlong n2,longlong p,long_double invp){ longlong s=A; longlong t = mulmodll(*W,An2,p,invp); A = addmodll(s,t,p); An2 = submodll(s,t,p); } #endif #if !defined NUMWORKS // !defined VISUALC && !defined USE_GMP_REPLACEMENTS && defined GIAC_LLPRECOND // de-recurse static void fft2pnopermbefore( longlong *A, longlong n, longlong *W,longlong p,long_double invp,longlong step) { if (n==0) CERR << "bug\n"; if (n<=1 ) return; if (n==2){ longlong f0=A[0],f1=A[1]; A[0]=addmodll(f0,f1,p); A[1]=submodll(f0,f1,p); return; } longlong n2s=n/2*step; // start by groups of 4 step=n2s/2; longlong w1=W[step],w1surp=W[3*step]; longlong *Aeff=A; for (longlong pos=0;posMAX_INTSTACK/2) Wstack=(longlong *)malloc(n*sizeof(longlong)); else Wstack=Wstack_; // now by 8, then by 16, etc. for (longlong taille=8;taille<=n;taille*=2){ step /= 2; Aeff=A; if (taille==n && step==1){ longlong *An2=Aeff+n/2,*Aend=An2,*Weff=W+n2s; for(; AeffMAX_INTSTACK/2) free(Wstack); } #else // de-recurse static void fft2pnopermbefore( longlong *A, longlong n, longlong *W,longlong p,long_double invp,longlong step) { if ( n==1 ) return; // if p is fixed, the code is about 2* faster if (n==4){ longlong w1=W[step]; longlong f0=A[0],f1=A[1],f2=A[2],f3=A[3], #ifdef GIAC_LLPRECOND f01=precond_mulmodll(submodll(f1,f3,p),w1,W[3*step],p), #else f01=mulmodll(submodll(f1,f3,p),w1,p,invp), #endif f02p=addmodll(f0,f2,p),f02m=submodll(f0,f2,p),f13=addmodll(f1,f3,p); A[0]=addmodll(f02p,f13,p); A[1]=addmodll(f02m,f01,p); A[2]=submodll(f02p,f13,p); A[3]=submodll(f02m,f01,p); return; } if (n==2){ longlong f0=A[0],f1=A[1]; A[0]=addmodll(f0,f1,p); A[1]=submodll(f0,f1,p); return; } fft2pnopermbefore(A, n/2, W,p,invp,2*step); fft2pnopermbefore(A+n/2, n/2, W,p,invp,2*step); longlong * An2=A+n/2; longlong * Aend=A+n/2; longlong n2s = n/2*step; // n2%4==0 for(; A>63)&p; return; longlong chk=(((int128_t(Ai)+(p-An2i))* *Wcur) % p); if ( An2cur!=chk) //(An2cur-int128_t(chk))%p!=0) CERR<<"err\n"; An2cur=chk; } #endif #if !defined NUMWORKS // !defined VISUALC && !defined USE_GMP_REPLACEMENTS && defined GIAC_LLPRECOND // de-recurse static void fft2pnopermafter( longlong *A, longlong n, longlong *W,longlong p,long_double invp,longlong step) { if (n==0) CERR << "bug\n"; if (n<=1 ) return; if (n==2){ longlong f0=A[0],f1=A[1]; A[0]=addmodll(f0,f1,p); A[1]=submodll(f0,f1,p); return; } longlong n2s=n/2*step; // group by decreasing size longlong Wstack_[MAX_INTSTACK/2]; longlong *Wstack=0; if (n>MAX_INTSTACK/2) Wstack=(longlong *)malloc(n*sizeof(longlong)); else Wstack=Wstack_; longlong * end=Wstack+n,*source=W,*source2=W+n2s; for (longlong * target=Wstack;target=8;taille/=2){ longlong * Aeff=A; for (longlong pos=0;posMAX_INTSTACK/2) free(Wstack); // finish by groups of 4 step=n2s/2; longlong w1=W[step],w1surp=W[3*step]; longlong *Aeff=A; for (longlong pos=0;pos & source,vector & a,longlong N,longlong p){ a.clear(); a.resize(N); if (source.empty()) return; const longlong * stop=&*source.begin(),*start=&*source.end()-1; longlong i=0; for (;i=stop;i++,--start){ longlong k=*start; k += (k>>63)&p; // add p if k is negative a[i]=k; } for (i=0;start>=stop;--start){ longlong k=*start; k += (k>>63)&p; k += (a[i]-p); k += (k>>63)&p; a[i]= k ; ++i; if (i==N) i=0; } } void makemodulop(longlong * a,longlong as,longlong modulo){ longlong *aend=a+as; for (;a!=aend;++a){ *a %= modulo; // if (*a<0) *a += modulo; // *a -= (unsigned(modulo-*a)>>31)*modulo; } } void makepositive(longlong * p,longlong n,longlong modulo){ longlong * pend=p+n; for (;p!=pend;++p){ longlong P=*p; P += (P>>63) & modulo; P += (P>>63) & modulo; *p=P; } } void to_fft(const std::vector & a,longlong modulo,longlong w,std::vector & Wp,longlong n,std::vector & f,bool reverse,bool makeplus,bool makemod=true){ long_double invp=long_double(1)/modulo; #if defined GIAC_LLPRECOND longlong nw=n; #else longlong nw=n/2; #endif longlong s=giacmin(a.size(),n); longlong logrs=sizeinbase2(n-1); if (reverse){ if (&f==&a){ if (f.size()>n){ vector tmp(n); reverse_assign(a,tmp,n,modulo); tmp.swap(f); } else { vector::iterator it=f.begin(),itend=f.end(); for (;it!=itend;++it) *it += (*it>>63)&modulo; std::reverse(f.begin(),f.end()); f.resize(n); } } else { f.resize(n); reverse_assign(a,f,n,modulo); } } else { if (&f!=&a) f=a; f.resize(n); } if (makemod) makemodulop(&f.front(),s,modulo); if (makeplus) makepositive(&f.front(),s,modulo); if (Wp.size() & f,longlong p,std::vector & Wp,std::vector & res,bool reverseatend,bool revw){ long_double invp=long_double(1)/p; if (&res!=&f) res=f; longlong n=res.size(); #if defined GIAC_LLPRECOND int nw=n; #else int nw=n/2; #endif if (revw) fft_reverse(Wp,p); fft2pnopermbefore(&res.front(),n,&Wp.front(),p,invp,Wp.size()/nw); if (revw) fft_reverse(Wp,p); longlong i=invmodll(n,p); //mulmodll(res,i,p,invp); i += (i>>63)&p; precond_mulmodll(res,i,preconditionner_ll(i,p),p); if (reverseatend) reverse(res.begin(),res.end()); } void fft_ab_cd_p(const vector &a,const vector &b,const vector & c,const vector &d,vector & res,longlong p){ long_double invp=long_double(1)/p; longlong s=a.size(); res.resize(s); for (longlong i=0;i0){ if (n%2) c=amodpll(c*int128_t(b),m,invm); n /= 2; b=amodpll(b*int128_t(b),m,invm); } return c; } longlong powmodll(longlong a,ulonglong n,longlong m){ return powmodll(a,n,m,long_double(1)/m); } // for p prime such that p-1 is divisible by 2^N, compute a 2^N-th root of 1 // otherwise return 0 longlong nthroot(longlong p,longlong N){ longlong expo=(p-1)>>N; if ( (expo< & Wp,longlong shift,longlong p){ longlong n=1<[a,b] bool matrix22lltimesvect(const vector & RA,const vector & RB,const vector & RC,const vector & RD,const vector & a0,const vector &a1,longlong maxadeg,longlong maxbdeg,vector & a,vector &b,longlong p,vector & ra,vector & rb,vector & rc,vector & rd,vector &Wp){ longlong dega0=a0.size()-1,m=(dega0+1)/2; longlong maxabdeg=giacmax(maxadeg,maxbdeg); longlong bbsize=giacmin(maxabdeg+1,a0.size()); longlong ddsize=giacmin(maxabdeg+1,a1.size()); longlong Nreal=giacmax(bbsize+RC.size(),ddsize+RD.size())-2; int N2=giacmin(maxabdeg,Nreal); unsigned long l=sizeinbase2(N2)-1; longlong n=1<<(l+1); longlong w=find_wll(Wp,l+1,p); // vector adbg,bdbg; if (!w) return false; to_fft(RA,p,w,Wp,n,b,true,false,false);ra.swap(b); to_fft(RB,p,w,Wp,n,b,true,false,false);rb.swap(b); to_fft(RC,p,w,Wp,n,b,true,false,false);rc.swap(b); to_fft(RD,p,w,Wp,n,b,true,false,false);rd.swap(b); to_fft(a0,p,w,Wp,n,a,true,false,false); to_fft(a1,p,w,Wp,n,b,true,false,false); fft_reverse(Wp,p); fft_ab_cd_p(rc,a,rd,b,rc,p); from_fft(rc,p,Wp,rc,true,false); fft_ab_cd_p(ra,a,rb,b,ra,p); from_fft(ra,p,Wp,ra,true,false); a.swap(ra); b.swap(rc); trim_deg(a,maxabdeg); fast_trim_inplace(a,p); trim_deg(b,maxabdeg); fast_trim_inplace(b,p); return true; } bool matrix22ll(vector & RA,vector &RB,vector & RC,vector &RD,vector &SA,vector &SB,vector &SC,vector &SD,vector &A,vector &B,vector &C,vector &D,longlong p,vector & tmp,vector & Wp){ // 2x2 matrix operations // [[SA,SB],[SC,SD]]*[[RC,RD],[RA,RB]] == [[RA*SB+RC*SA,RB*SB+RD*SA],[RA*SD+RC*SC,RB*SD+RD*SC]] int Nreal=giacmax(giacmax(RC.size(),RD.size()),giacmax(RA.size(),RB.size()))+giacmax(giacmax(SC.size(),SD.size()),giacmax(SA.size(),SB.size()))-2; unsigned long l=sizeinbase2(Nreal)-1; // l=gen(Nreal).bindigits()-1; // m=2^l <= Nreal < 2^{l+1} unsigned long n=1<<(l+1); longlong w=nthroot(p,l+1); // vector adbg,bdbg; if (!w) return false; // makepositive set to false since reverse_assign should make RA positive to_fft(SC,p,w,Wp,n,SC,true,false,false); to_fft(SD,p,w,Wp,n,SD,true,false,false); to_fft(RA,p,w,Wp,n,RA,true,false,false); to_fft(RB,p,w,Wp,n,RB,true,false,false); to_fft(RC,p,w,Wp,n,RC,true,false,false); to_fft(RD,p,w,Wp,n,RD,true,false,false); to_fft(SA,p,w,Wp,n,SA,true,false,false); to_fft(SB,p,w,Wp,n,SB,true,false,false); fft_reverse(Wp,p); fft_ab_cd_p(RA,SB,RC,SA,A,p); from_fft(A,p,Wp,A,true,false); fft_ab_cd_p(RB,SB,RD,SA,SA,p); SA.swap(B); from_fft(B,p,Wp,B,true,false); fft_ab_cd_p(RA,SD,RC,SC,RA,p); RA.swap(C); from_fft(C,p,Wp,C,true,false); fft_ab_cd_p(RB,SD,RD,SC,RB,p); RB.swap(D); from_fft(D,p,Wp,D,true,false); // fft_reverse(Wp,p); fast_trim_inplace(A,p); fast_trim_inplace(B,p); fast_trim_inplace(C,p); fast_trim_inplace(D,p); return true; } void a_bc(const vector &a,const vector &b,const vector &c,longlong p,vector & res,vector & tmp1){ // res=trim(a-b*c,env); return; size_t as=a.size(),bs=b.size(); if (as<=bs){ tmp1.clear(); tmp1.reserve(bs); if (c.size()==2){ a_minus_qsize2_b(a,c,b,tmp1,p); tmp1.swap(res); return; } } smallmultll(b,c,tmp1,p); submodnegll(tmp1,a,p); tmp1.swap(res); } bool hgcdll(const vector & a0,const vector & a1,longlong modulo,vector & Wp,vector &A,vector &B,vector &C,vector &D,vector & coeffv,vector & degv,vector & q,vector & f,vector & tmp0,vector & tmp1,vector & tmp2,vector & tmp3){ // a0 is A in Yap, a1 is B vector & g0=tmp2,&g1=tmp3; longlong dega0=a0.size()-1,dega1=a1.size()-1; longlong m=(dega0+1)/2; if (dega1(1,1); B.clear(); C.clear(); return true; } if (m b0(a0.begin(),a0.end()-m); // quo(a0,x^m), A0 in Yap vector b1(a1.begin(),a1.end()-m); // quo(a1,x^m), B0 in Yap // 1st recursive call vector RA,RB,RC,RD; if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " hgcdll 1st recursive call " << dega0 << "," << dega1 << '\n'; if (!hgcdll(b0,b1,modulo,Wp,RA,RB,RC,RD,coeffv,degv,tmp0,tmp1,A,B,C,D)) return false; if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " hgcdll compute A' B' " << dega0 << "," << dega1 << '\n'; longlong maxadeg=dega0+1-giacmax(RA.size(),RB.size()),maxbdeg=dega0-m/2; matrix22lltimesvect(RA,RB,RC,RD,a0,a1,maxadeg,maxbdeg,b0,b1,modulo,tmp0,tmp1,tmp2,tmp3,Wp); longlong dege=b1.size()-1; if (dege=b0.size()-1) COUT << "hgcdll error" << '\n'; if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " hgcdll euclid div " << dega0 << "," << dega1 << '\n'; // 1 euclidean step if (!degv.empty()){ coeffv.push_back(b1[0]); degv.push_back(degv.back()+b1.size()-b0.size()); } DivRem(b0,b1,modulo,q,f); // q,f are Q,D in Yap // [[0,1],[1,-q]]*[[RA,RB],[RC,RD]] == [[RC,RD],[-RC*q+RA,-RD*q+RB]] a_bc(RA,RC,q,modulo,RA,tmp1); // RA=trim(RA-RC*q,&env); a_bc(RB,RD,q,modulo,RB,tmp1); // RB=trim(RB-RD*q,&env); longlong l=b1.size()-1,k=2*m-l; if (f.size()-1 g0(b1.begin(),b1.end()-k); // quo(b,x^k), C0 in Yap if (f.size()>k){ g1.resize(f.size()-k); copy(f.begin(),f.end()-k,g1.begin()); // quo(f,x^k), D0 in Yap } vector &SA=b0,&SB=b1,&SC=q,&SD=f; if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " hgcdll 2nd recursive call " << dega0 << "," << dega1 << '\n'; if (!hgcdll(g0,g1,modulo,Wp,SA,SB,SC,SD,coeffv,degv,tmp0,tmp1,A,B,C,D)) return false; if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " hgcdll end 2nd recursive call " << dega0 << "," << dega1 << '\n'; matrix22ll(RA,RB,RC,RD,SA,SB,SC,SD,A,B,C,D,modulo,tmp0,Wp); if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " hgcdll end " << dega0 << "," << dega1 << '\n'; return true; } void mulsmall(vector & Q,longlong c,longlong m){ if (c==1) return; //long_double invm=long_double(1)/long_double(m); longlong * ptr=&Q.front(), * ptrend=ptr+Q.size(); for (;ptr!=ptrend;++ptr){ //*ptr =amodpll(int128_t(*ptr)*c,m,invm); *ptr = (int128_t(*ptr)*c)%m; } } // resultant of P and Q modulo m, modifies P and Q, longlong resultantll(vector & P,vector & Q,vector & tmp1,vector & tmp2,longlong m){ if (P.size()Q.size() int HGCD2=HGCD; if (Q.size()>=HGCD2){ vector coeffv,degv,A,B,C,D,a,b,b0,b1,b2,b3,b4,b5,b6,b7,Wp; coeffv.reserve(Q.size()+1); degv.reserve(Q.size()+1); degv.push_back(P.size()-1); while (Q.size()>=HGCD2){ int deg1=P.size(),deg2=(3*deg1)/4; double coeff=nextpow2(deg1/2)*2./deg1; double coeff2=nextpow2(deg2)/double(deg2); coeff=0.5*std::min(coeff,coeff2); if (Wp.empty() && m!=p1 && m!=p2 && m!=p3){ longlong l=sizeinbase2(int(3*2*coeff/4*deg1-1)); longlong w=find_wll(Wp,l,m); fft2wp(Wp,(1<2) CERR << CLOCK()*1e-6 << " deg " << P.size() << " coeff " << coeff << "\n"; int seuil=1+int(std::ceil((1-coeff)*P.size())); if (HGCD/4>=Q.size()-seuil){ coeffv.push_back(Q.front()); degv.push_back(degv.back()+Q.size()-P.size()); DivRem(P,Q,m,a,b); P.swap(Q); Q.swap(b); continue; } // 1st recursive call b0.resize(P.size()-seuil); copy(P.begin(),P.end()-seuil,b0.begin()); // quo(P,x^s), b1.resize(Q.size()-seuil); copy(Q.begin(),Q.end()-seuil,b1.begin()); // quo(Q,x^s), hgcdll(b0,b1,m,Wp,A,B,C,D,coeffv,degv,b2,b3,b4,b5,b6,b7); longlong maxadeg=P.size()-giacmax(A.size(),B.size()); matrix22lltimesvect(A,B,C,D,P,Q,maxadeg,maxadeg,a,b,m,b4,b5,b6,b7,Wp); if (b.size()1){ #if 0 longlong coeff=Q[0]; longlong invcoeff=invmodll(coeff,m); mulsmall(Q,invcoeff,m); DivRem(P,Q,m,tmp1,tmp2); res = (res*powmodll(coeff,ulonglong(P.size()-1),m)) %m; #else DivRem(P,Q,m,tmp1,tmp2); res = amodpll(res*powmodll(Q[0],P.size()-tmp2.size(),m,invm),m,invm); #endif if (P.size()%2==0 && Q.size()%2==0) res = -res; P.swap(Q); Q.swap(tmp2); } if (Q.empty()) return 0; res = amodpll(res*powmodll(Q[0],ulonglong(P.size()-1),m,invm),m,invm); return smodll(res,m); } void int2longlong(const vector & p,vector & P,int modulo){ longlong m=modulo?modulo:p5; size_t s=p.size(); if (P.size() & p,const vector & q,vector & PQ,vector & W,int modulo){ if (debug_infolevel) CERR << CLOCK()*1e-6 << "fft2p5 begin" << '\n'; int ps=int(p.size()),qs=int(q.size()),rs=ps+qs-1; int logrs=sizeinbase2(rs); if (logrs>54) return false; int n=(1u< P(n),Q(n); int2longlong(p,P,modulo); int2longlong(q,Q,modulo); if (W.empty() || W[0]==0){ //const longlong r=4917923076487504807LL; longlong w=4917923076487504807LL; for (int i=0;i<54-logrs;++i) w=(int128_t(w)*w) % p5; // longlong w=powmodll(r,(1ul<<(54-logrs)),p5); fft2wp(W,n,w,p5); } fft2pnopermafter(&P.front(),n,&W.front(),p5,invp5,1); fft2pnopermafter(&Q.front(),n,&W.front(),p5,invp5,1); for (int i=0;ip5/2) P[i] -= p5; } } reverse(P.begin(),P.end()); PQ.reserve(rs); int i; for (i=0;i=p>2^(nbits-1) // assumes invp=2^(2*nbits)/p+1 has been precomputed // and abs(x)<2^(31+nbits) // |remainder| <= max(2^nbits,|x|*p/2^(2nbits)), <=2*p if |x|<=p^2 inline longlong pseudo_mod(longlong x,int p,unsigned invp){ return x - (((x>>31)*invp)>>31)*p; } void fft_ab_p(const vector &a,const vector &b,vector & res,int p){ int s=a.size(); res.resize(s); #if 1 double invp=find_invp(p); for (int i=0;i &a,const vector &b,vector & res,int p){ int s=a.size(); res.resize(s); for (int i=0;i>31)&p; res[i]=(longlong(a[i])*bi)%p; } } void fft_ab_cd_p(const vector &a,const vector &b,const vector & c,const vector &d,vector & res,int p){ int s=a.size(); res.resize(s); #if 1 //def __x86_64__ double invp=find_invp(p); for (int i=0;i &a,const vector &b,const vector & c,const vector &d,vector & res){ int s=a.size(); res.resize(s); for (int i=0;i &a,const vector &b,const vector & c,const vector &d,vector & res){ int s=a.size(); res.resize(s); for (int i=0;i &a,const vector &b,const vector & c,const vector &d,vector & res){ int s=a.size(); res.resize(s); for (int i=0;i=0 to an upper bound of the degree if you know one void ab_cd(int N,const modpoly &a,const modpoly &b,const modpoly &c,const modpoly & d,environment * env,modpoly & res,modpoly & tmp1,modpoly & tmp2){ modpoly resdbg; if (N>=0){ if (a.size()>=FFTMUL_SIZE/4 && b.size()>=FFTMUL_SIZE/4 && c.size()>=FFTMUL_SIZE/4 && d.size()>=FFTMUL_SIZE/4 && env->moduloon){ // N is the degree after reduction mod env->modulo // but not the degree of a*b+c*d // therefore we make computation mod x^n-1 int Nreal=giacmax(a.size()+b.size(),c.size()+d.size())-2; gen pPQ(Nreal*(2*env->modulo*env->modulo)+1); unsigned long l=gen(giacmin(N,Nreal)).bindigits()-1; // m=2^l <= Nreal < 2^{l+1} unsigned long n=1<<(l+1); if (env->modulo.type==_INT_){ int p=env->modulo.val; vector aa; reverse_assign(a,aa,n,p); vector bb; reverse_assign(b,bb,n,p); vector cc; reverse_assign(c,cc,n,p); vector dd; reverse_assign(d,dd,n,p); vector Wp1,Wp2,Wp3; fft_rep aaf; to_fft(aa,p,Wp1,Wp2,Wp3,n,aaf,false,true); fft_rep bbf; to_fft(bb,p,Wp1,Wp2,Wp3,n,bbf,false,true); fft_rep ccf; to_fft(cc,p,Wp1,Wp2,Wp3,n,ccf,false,true); fft_rep ddf; to_fft(dd,p,Wp1,Wp2,Wp3,n,ddf,false,true); // a*b + c*d FFT size fft_rep resf; fft_ab_cd(aaf,bbf,ccf,ddf,resf); from_fft(resf,Wp1,Wp2,Wp3,dd,aa,bb,cc,true,true); vector_int2vecteur(dd,res); if (res.size()>N+1) res=modpoly(res.end()-N-1,res.end()); trim_inplace(res,env); return; } unsigned long bound=pPQ.bindigits()+1; // 2^bound=smod bound on coeff of p*q unsigned long r=(bound >> l)+1; if (0){ // not checked vector Wp1,Wp2,Wp3; multi_fft_rep aaf; to_multi_fft(a,env->modulo,Wp1,Wp2,Wp3,n,aaf,true,true); multi_fft_rep bbf; to_multi_fft(b,env->modulo,Wp1,Wp2,Wp3,n,bbf,true,true); multi_fft_rep ccf; to_multi_fft(c,env->modulo,Wp1,Wp2,Wp3,n,ccf,true,true); multi_fft_rep ddf; to_multi_fft(d,env->modulo,Wp1,Wp2,Wp3,n,ddf,true,true); multi_fft_rep resf; multi_fft_ab_cd(aaf,bbf,ccf,ddf,resf); from_multi_fft(resf,Wp1,Wp2,Wp3,res,true); trim_inplace(res,env); return; } if (l>=2 && bound>=(1<<(l-2)) ){ mpz_t tmp,tmpqz; mpz_init(tmp); mpz_init(tmpqz); gen tmp1,tmp2; tmp1.uncoerce(); tmp2.uncoerce(); unsigned long expoN=r << l; // r*2^l modpoly aa; reverse_assign(a,aa,n,expoN+2); modpoly work; reverse_resize(work,n,expoN+2); fft2rl(&aa.front(),n,r,l,&work.front(),true,tmp1,tmp2,tmpqz); modpoly bb; reverse_assign(b,bb,n,expoN+2); fft2rl(&bb.front(),n,r,l,&work.front(),true,tmp1,tmp2,tmpqz); modpoly cc; reverse_assign(c,cc,n,expoN+2); fft2rl(&cc.front(),n,r,l,&work.front(),true,tmp1,tmp2,tmpqz); modpoly dd; reverse_assign(d,dd,n,expoN+2); fft2rl(&dd.front(),n,r,l,&work.front(),true,tmp1,tmp2,tmpqz); // a*b+c*d FFT size reverse_resize(res,n,expoN+2); fft_ab_cd(aa,bb,cc,dd,expoN,res,tmp,tmpqz); fft2rl(&res.front(),n,r,l,&work.front(),false,tmp1,tmp2,tmpqz); // divide by n mod 2^expoN+1 fft2rldiv(res,expoN,expoN-l-1,tmp,tmpqz); if (res.size()>N+1) res=modpoly(res.end()-N-1,res.end()); trim_inplace(res,env); mpz_clear(tmpqz); mpz_clear(tmp); return; resdbg=res; } } if (1 && a.size()>N+1){ ab_cd(N,modpoly(a.end()-N-1,a.end()),b,c,d,env,res,tmp1,tmp2); return; } if (1 && b.size()>N+1){ ab_cd(N,a,modpoly(b.end()-N-1,b.end()),c,d,env,res,tmp1,tmp2); return; } if (1 && c.size()>N+1){ ab_cd(N,a,b,modpoly(c.end()-N-1,c.end()),d,env,res,tmp1,tmp2); return; } if (1 && d.size()>N+1){ ab_cd(N,a,b,c,modpoly(d.end()-N-1,d.end()),env,res,tmp1,tmp2); return; } } // end if (N>=0) // res=trim(a*b+c*d,env); return; if (1 // && env && env->moduloon && env->modulo.type==_INT_ && longlong(env->modulo.val)*env->modulo.val<(1LL<<31) ){ // smod at end, faster for small modulo (modulo^2<2^31) environment zeroenv; tmp1.clear(); if (!a.empty() && !b.empty()) operator_times(a,b,&zeroenv,tmp1,N>=0?N:RAND_MAX); if (N>=0 && tmp1.size()>N+1) tmp1=modpoly(tmp1.end()-N-1,tmp1.end()); #if 0 // debug tmp2.clear(); if (!a.empty() && !b.empty()) operator_times(a,b,&zeroenv,tmp2,RAND_MAX); if (N>=0 && tmp2.size()>N+1) tmp2=modpoly(tmp2.end()-N-1,tmp2.end()); if (tmp1!=tmp2) COUT << "error" << tmp1-tmp2 << '\n'; #endif tmp2.clear(); if (!c.empty() && !d.empty()) operator_times(c,d,&zeroenv,tmp2,N>=0?N:RAND_MAX); if (N>=0 && tmp2.size()>N+1) tmp2=modpoly(tmp2.end()-N-1,tmp2.end()); #if 0 addmodpoly(tmp1,tmp2,res); #else if (tmp1.size()>=tmp2.size()){ if (!tmp2.empty()) addmodpoly(tmp1,tmp2,tmp1); res.swap(tmp1); } else { if (!tmp1.empty()) addmodpoly(tmp2,tmp1,tmp2); res.swap(tmp2); } #endif trim_inplace(res,env); if (!resdbg.empty() && res!=resdbg) COUT << res-resdbg << '\n'; } else { tmp1.clear(); if (!a.empty() && !b.empty()) operator_times(a,b,env,tmp1); tmp2.clear(); if (!c.empty() && !d.empty()) operator_times(c,d,env,tmp2); addmodpoly(tmp1,tmp2,env,res); trim_inplace(res,env); } } inline int precond_mulmodp(unsigned A,unsigned W,unsigned Winvp,int p){ #if 1 longlong t = ulonglong(A)*W-((ulonglong(A)*Winvp)>>32)*p; return t+ ((t>>31)&p); #else longlong t = ulonglong(A)*W-((ulonglong(A)*Winvp)>>32)*p; //return t- (t>>63)*p; int tt= t- (t>>63)*p; unsigned s=(ulonglong(A)*W)%p; if (tt!=s) CERR << '\n'; return s; #endif } inline int mulmodp(int a,int b,int p){ return (longlong(a)*b) % p; } inline int mulmodp(int a,int b,int p,double invp){ int t=amodp(longlong(a)*b, p,invp); //t=(longlong(a)*b) % p; //t += (t>>31)&p; return t; } inline int pos_mulmodp(int a,int b,int p,double invp){ int t=apos_modp(longlong(a)*b, p,invp); return t; } // reverse *a..*b and neg void fft_rev1(int * a,int *b,longlong p){ for (;b>a;++a,--b){ int tmp=*a; *a=p-*b; *b=p-tmp; } if (a==b) *a=p-*a; } #ifdef GIAC_PRECOND // preconditionned void fft_reverse(vector & W,int p){ if (W.size()<2) return; int * a=&W.front(); int N=W.size()/2; fft_rev1(a+1,a+N-1,p); fft_rev1(a+N+1,a+2*N-1,1); } void fft2wp(vector & W,int n,int w,int p){ W.resize(n); w %= p; if (w<0) w += p; double invp=double(1ULL<<32)/p; int N=n/2; unsigned ww=1; for (int i=0;i & W,int n,int w){ W.resize(n); const int p = p1 ; w=w % p; if (w<0) w += p; int N=n/2; unsigned ww=1; for (int i=0;i & W,int n,int w){ W.resize(n); const int p = p2 ; w=w % p; if (w<0) w += p; int N=n/2; unsigned ww=1; for (int i=0;i & W,int n,int w){ W.resize(n); const int p = p3 ; w=w % p; if (w<0) w += p; int N=n/2; unsigned ww=1; for (int i=0;i & W,int p){ if (W.size()<2) return; int * a=&W.front(); #ifdef GIAC_CACHEW for (int N=(W.size()+1)/2;N>=2;a+=N,N/=2){ fft_rev1(a+1,a+N-1,p); } #else fft_rev1(a+1,a+W.size()-1,p); #endif } void fft2wp_add(vector & W,int N){ int step=1; for (N/=2;N;N/=2){ step *= 2; for (int i=0;i & W,int n,int w,int p){ #ifdef GIAC_CACHEW W.reserve(n); #else W.reserve(n/2); #endif double invp=find_invp(p); w=amodp(w,p,invp); if (w<0) w += p; int N=n/2,ww=1; for (int i=0;i & W,int n,int w){ #ifdef GIAC_CACHEW W.reserve(n); #else W.reserve(n/2); #endif const int p = p1 ; w=w % p; if (w<0) w += p; int N=n/2,ww=1; for (int i=0;i & W,int n,int w){ #ifdef GIAC_CACHEW W.reserve(n); #else W.reserve(n/2); #endif const int p = p2 ; w=w % p; if (w<0) w += p; int N=n/2,ww=1; for (int i=0;i & W,int n,int w){ #ifdef GIAC_CACHEW W.reserve(n); #else W.reserve(n/2); #endif const int p = p3 ; w=w % p; if (w<0) w += p; int N=n/2,ww=1; for (int i=0;i & W,int p){ if (p==p1 || p==p2 || p==p3){ fft_reverse(W,p); return; } if (W.size()<2) return; int * a=&W.front(); for (int N=(W.size()+1)/2;N;a+=N,N/=2){ fft_rev1(a+1,a+N-1,p); } } //#define DEBUG 1 // [[RA,RB],[RC,RD]]*[a0,a1]->[a,b] void matrix22inttimesvect(const vector & RA,const vector & RB,const vector & RC,const vector & RD,const vector & a0,const vector &a1,int maxadeg,int maxbdeg,vector & a,vector &b,int p,vector & ra,vector & rb,vector & rc,vector & rd,vector &Wp){ int dega0=a0.size()-1,m=(dega0+1)/2; int maxabdeg=giacmax(maxadeg,maxbdeg); int bbsize=giacmin(maxabdeg+1,a0.size()); int ddsize=giacmin(maxabdeg+1,a1.size()); int Nreal=giacmax(bbsize+RC.size(),ddsize+RD.size())-2; int N2=giacmin(maxabdeg,Nreal); // add 1 if fft is done without reverse unsigned long l=sizeinbase2(N2)-1; // l=gen(N2).bindigits()-1; // m=2^l <= Nreal < 2^{l+1} unsigned long n=1<<(l+1); if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " mat22vectint begin n=" << n << " N2=" << N2 << " ra=" << ra.size() << '\n'; int w=find_w(Wp,l+1,p); #ifdef GIAC_CACHEW //Wp.clear(); #endif // vector adbg,bdbg; if (w){ if (N2 a0_,a1_; reverse_assign(RA,ra,n,p); reverse_assign(RB,rb,n,p); reverse_assign(RC,rc,n,p); reverse_assign(RD,rd,n,p); reverse_assign(a0,a0_,n,p); reverse_assign(a1,a1_,n,p); vector Wp1,Wp2,Wp3; fft_rep raf; to_fft(ra,p,Wp1,Wp2,Wp3,n,raf,false,true); fft_rep rbf; to_fft(rb,p,Wp1,Wp2,Wp3,n,rbf,false,true); fft_rep rcf; to_fft(rc,p,Wp1,Wp2,Wp3,n,rcf,false,true); fft_rep rdf; to_fft(rd,p,Wp1,Wp2,Wp3,n,rdf,false,true); fft_rep a0f; to_fft(a0_,p,Wp1,Wp2,Wp3,n,a0f,false,true); fft_rep a1f; to_fft(a1_,p,Wp1,Wp2,Wp3,n,a1f,false,true); fft_rep resf; fft_ab_cd(raf,a0f,rbf,a1f,resf); fft_reverse(Wp1,p1); fft_reverse(Wp2,p2); fft_reverse(Wp3,p3); from_fft(resf,Wp1,Wp2,Wp3,a,ra,rb,rc,true,false); fft_ab_cd(rcf,a0f,rdf,a1f,resf); from_fft(resf,Wp1,Wp2,Wp3,b,ra,rb,rc,true,false); //fft_reverse(Wp1,p1); fft_reverse(Wp2,p2); fft_reverse(Wp3,p3); fast_trim_inplace(a,p,maxabdeg+1); //trim_deg(b,maxabdeg); fast_trim_inplace(b,p,maxabdeg+1); } // if (w && a!=adbg && b!=bdbg) CERR << "err\n"; //trim_deg(a,maxabdeg); if (debug_infolevel>2) CERR << CLOCK()*1e-6 << " mat22vectint end " << n << '\n'; } // [[RA,RB],[RC,RD]]*[a0,a1]->[a,b] void matrix22timesvect(const modpoly & RA,const modpoly & RB,const modpoly & RC,const modpoly & RD,const modpoly & a0,const modpoly &a1,int maxadeg,int maxbdeg,modpoly & a,modpoly &b,environment & env,modpoly & tmp1,modpoly & tmp2){ bool doit=true; int dega0=a0.size()-1,m=(dega0+1)/2; int maxabdeg=giacmax(maxadeg,maxbdeg); if (1&& env.moduloon && a0.size()>=FFTMUL_SIZE/4 && a1.size()>=FFTMUL_SIZE/4 && RA.size()>=FFTMUL_SIZE/4 && RB.size()>=FFTMUL_SIZE/4){ int bbsize=giacmin(maxabdeg+1,a0.size()); int ddsize=giacmin(maxabdeg+1,a1.size()); int Nreal=giacmax(bbsize+RC.size(),ddsize+RD.size())-2; int N2=giacmin(maxabdeg,Nreal); gen pPQ(Nreal*(2*env.modulo*env.modulo)+1); unsigned long l=gen(N2).bindigits()-1; // m=2^l <= Nreal < 2^{l+1} unsigned long n=1<<(l+1); unsigned long bound=pPQ.bindigits()+1; // 2^bound=smod bound on coeff of p*q unsigned long r=(bound >> l)+1; if (env.modulo.type==_INT_){ doit=false; int p=env.modulo.val; vector ra; reverse_assign(RA,ra,n,p); vector rb; reverse_assign(RB,rb,n,p); vector