「题解」AGC038C LCMs
\(i\) 和 \(j\) 不对称很烦,求 \(\sum_i\sum_j\mathrm{lcm}(A_i,A_j)\) 再减去 \(\sum_i A_i\) 再除 \(2\) 即可得到答案。现在来考虑 \(i\) 和 \(j\) 取值均为 \(0\sim N-1\) 的式子:
\[\begin{aligned}
&\sum_i\sum_j\mathrm{lcm}(A_i,A_j)
\\
=&\sum_i\sum_j\frac{A_iA_j}{\gcd(A_i,A_j)}
\\
=&\sum_d\frac{1}{d}\sum_i\sum_j A_iA_j[\gcd(A_i,A_j)=d]
\end{aligned}
\]
\([\gcd(A_i,A_j)=d]\) 我们束手无策,但 \([\gcd(i,j)=d]\) 我们熟能生巧
于是考虑定义域与值域互换的技巧,也就是令 \(B_i\) 为 \(i\) 在 \(A\) 中的出现次数,则有:
\[\begin{aligned}
&\sum_{d}\frac{1}{d}\sum_{d|i}\sum_{d|j}B_iB_jij[\gcd(i,j)=d]
\\=&\sum_{d}\frac{1}{d}\sum_{i,j}B_{id}B_{jd}ijd^2\sum_{e|i,e|j}\mu(e)
\\=&\sum_{d}d\sum_e\mu(e)\left(\sum_{e|i}B_{id}i\right)^2
\\=&\sum_{d}d\sum_e\mu(e)\left(\sum_{de|i}B_{i}\frac{i}{d}\right)^2
\\=&\sum_{d}\frac{1}{d}\sum_e\mu(e)\left(\sum_{de|i}B_{i}i\right)^2
\end{aligned}
\]
然后发现最后面那个括号里面的可以预处理,称其为 \(f\),令 \(s=de\),枚举 \(s\) 再枚举 \(d\) 得到:
\[\begin{aligned}
\sum_s f(s)\sum_{d|s}\frac{1}{d}\mu(\frac{s}{d})
\end{aligned}
\]
发现后面依然是两个数论函数的狄利克雷卷积,设其为 \(g\),也可以预处理出。
令 \(m=\max(A)\),\(f,g\) 的预处理暴力实现均为 \(\mathcal{O}(m\log m)\).
不难发现 \(f\) 实际上是 \(B_ii\) 作狄利克雷后缀和,\(g\) 则是 \(\frac{1}{i}\) 和 \(\mu\) 作卷积,相当于对 \(\frac{1}{i}\) 作狄利克雷前缀差分。
于是均可以做到 \(\mathcal{O}(m\log \log m)\) 的复杂度。
在写这篇博客时暂且跑到了洛谷最优解。
#include<cstdio>
#include<vector>
#include<queue>
#include<cstring>
#include<iostream>
#include<algorithm>
#include<ctime>
#include<random>
#include<assert.h>
#define pb emplace_back
#define mp make_pair
#define fi first
#define se second
#define dbg(x) cerr<<"In Line "<< __LINE__<<" the "<<#x<<" = "<<x<<'\n';
#define dpi(x,y) cerr<<"In Line "<<__LINE__<<" the "<<#x<<" = "<<x<<" ; "<<"the "<<#y<<" = "<<y<<'\n';
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef pair<int,int>pii;
typedef pair<ll,int>pli;
typedef pair<ll,ll>pll;
typedef pair<int,ll>pil;
typedef vector<int>vi;
typedef vector<ll>vll;
typedef vector<pii>vpii;
typedef vector<pil>vpil;
template<typename T>T cmax(T &x, T y){return x=x>y?x:y;}
template<typename T>T cmin(T &x, T y){return x=x<y?x:y;}
#define getchar()(p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++)
char buf[1<<21],*p1=buf,*p2=buf;
inline void read(int& r){
r=0;bool w=0;char ch=getchar();
while(ch<'0'||ch>'9')w=ch=='-'?1:0,ch=getchar();
while(ch>='0'&&ch<='9')r=r*10+(ch^48),ch=getchar();
r=w?-r:r;
}
const int N=1000010;
const int mod=998244353;
int gcd(int a,int b){
return !b?a:gcd(b,a%b);
}
inline void cadd(int &x,int y){
x=(x+y>=mod)?(x+y-mod):(x+y);
}
inline void cdel(int &x,int y){
x=(x-y<0)?(x-y+mod):(x-y);
}
int qpow(int x,int y){
int s=1;
while(y){
if(y&1)s=1ll*s*x%mod;
x=1ll*x*x%mod;
y>>=1;
}
return s;
}
int n,mx,fac[N];
int vis[N],mu[N];
int f[N],g[N];
int ans;
vi pr;
void init(){
fac[0]=1;
for(int i=1;i<=mx;i++)fac[i]=1ll*fac[i-1]*i%mod;
g[mx]=qpow(fac[mx],mod-2);
for(int i=mx-1;~i;--i)g[i]=1ll*g[i+1]*(i+1)%mod;
for(int i=1;i<=mx;i++)g[i]=1ll*g[i]*fac[i-1]%mod;
mu[1]=1;
for(int i=2;i<=mx;i++){
if(!vis[i]){
pr.pb(i);
mu[i]=-1;
}
for(auto j:pr){
if(i*j>mx)break;
vis[i*j]=1;
if(i%j==0)break;
mu[i*j]=-mu[i];
}
}
for(int i=1;i<=mx;i++)
if(mu[i]==-1)
mu[i]=mod-1;
}
signed main(){
#ifdef do_while_true
// assert(freopen("data.in","r",stdin));
#endif
read(n);
for(int i=1;i<=n;i++){
int x;read(x);++f[x];cmax(mx,x);cdel(ans,x);
}
init();
for(int i=1;i<=mx;i++)f[i]=1ll*f[i]*i%mod;
for(auto x:pr)
for(int i=mx/x;i;i--)
cadd(f[i],f[i*x]),
cdel(g[i*x],g[i]);
for(int i=1;i<=mx;i++)f[i]=1ll*f[i]*f[i]%mod;
for(int i=1;i<=mx;i++)
cadd(ans,1ll*f[i]*g[i]%mod);
cout << 1ll*ans*499122177%mod << '\n';
#ifdef do_while_true
cerr<<'\n'<<"Time:"<<clock()/CLOCKS_PER_SEC<<" ms"<<'\n';
#endif
return 0;
}